А. Г. КУРОШ 


КУРС 

ВЫСШЕЙ АЛГЕБРЫ 

ИЗДАНИЕ ДЕВЯТОЕ 


Допущено Министерством 
высшего и среднего специального образования РСФСР 
в качестве учебника для университетов 



ИЗДАТЕЛЬСТВО «НАУКА» 
ГЛАВНАЯ РЕДАКЦИЯ 

ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 

МОСКВА 1968 




ОГЛАВЛЕНИЕ 


Предисловие к шестому изданию 5 

Введение 7 

Глава первая. Системы линейных уравнений. Определители 15 

§ 1. Метод последовательного исключения неизвестных 15 

§ 2. Определители второго и третьего порядков 23 

§ 3. Перестановки и подстановки 28 

§ 4. Определители л- го порядка 37 

§ 5. Миноры и их алгебраические дополнения 43 

§ 6. Вычисление определителей 46 

§ 7. Правило Крамера 53 

Глава вторая. Системы линейных уравнений (общая теория) 60 

§ 8. л-мерное векторное пространство 60 

§ 9. Линейная зависимость векторов 63 

§ 10. Ранг матрицы 70 

§ 11. Системы линейных уравнений 77 

§ 12. Системы линейных однородных уравнений 83 

Глава третья. Алгебра матриц 89 

§ 13. Умножение матриц 89 

§ 14. Обратная матрица 95 

§ 15. Сложение матриц и умножение матрицы на число 102 

§ 16*. Аксиоматическое построение теории определителей 105 

Глава четвертая. Комплексные числа ПО 

§ 17. Система комплексных чисел ПО 

§ 18. Дальнейшее изучение комплексных чисел 115 

§ 19. Извлечение корня из комплексных чисел 123 

Глава пятая. Многочлены и их корни . 130 

§ 20. Операции над многочленами 130 

§ 21. Делители. Наибольший общий делитель 135 

§ 22. Корни многочленов 143 

§ 23. Основная теорема 147 

§ 24. Следствия из основной теоремы 156 

§ 25*. Рациональные дроби 161 

Глава шестая. Квадратичные формы 166 

§ 26. Приведение квадратичной формы к каноническому виду . . 166 

§ 27. Закон инерции 174 

§ 28. Положительно определенные формы 179 

Глава седьмая. Линейные пространства 184 

§ 29. Определение линейного пространства. Изоморфизм 184 

§ 30. Конечномерные пространства. Базы 188 

§ 31. Линейные преобразования 194 

§ 32*. Линейные подпространства 201 

§ 33. Характеристические корни и собственные значения 206 



4 


ОГЛАВЛЕНИЕ 


Глава восьмая. Евклидовы пространства 211 

§ 34. Определение евклидова пространства. Ортонормированные 

базы 211 

§ 35. Ортогональные матрицы, ортогональные преобразоваиня . . 217 


§ 37. Приведение квадратичной формы к главным осям. Пары форм 226 

Глава девятая. Вычисление корней многочленов 233 

§ 38*. Уравнения второй, третьей и четвертой степени 233 

§ 39. Границы корней 241 

§ 40. Теорема Штурма . 246 

§ 41. Другие теоремы о числе действительных корней 252 

§ 42. Приближенное вычисление корней 259 

Глава десятая. Поля и многочлены 266 

§ 43. Числовые кольца и поля . . 256 

§ 44. Кольцо . 270 

§ 45. Поле 276 

§46*. Изоморфизм колец (полей). Единственность поля комплексных 

чисел 281 

§ 47. Линейная алгебра и алгебра многочленов над произвольным 

полем 285 

§ 48. Разложение многочленов на неприводимые множители . . . 290 

§ 49*. Теорема существования корня 298 

§ 50*. Поле рационалыіых дробей . 305 

Глава одиннадцатая. Многочлены от нескольких неизвестных 312 

§ 51. Кольцо многочленов от нескольких неизвестных 312 

§ 52. Симметрические многочлены .321 

§ 53*. Дополнительные замечания о симметрических многочленах 328 
§ 54*. Результант. Исключение неизвестного. Дискриминант . . .334 
§ 55*. Второе доказательство основной теоремы алгебры комплекс- . 

ных чисел , 345 

Глава двенадцатая. Многочлены с рациональными коэффициентами . . 350 
§ 56*. Приводимость многочленов над полем рациональных чисел 350 

§ 57*. Рациональные корни целочисленных многочленов 355 

§ 58*. Алгебраические числа 358 

Глава тринадцатая. Нормальная форма матрицы 364 

§ 59. Эквивалентность Я-матриц 364 

§ 60. Унимодулярные Я-матрицы. Связь подобия числовых матриц 

с эквивалентностью их характеристических матриц . . . . .371 

§ 61. Жорданова нормальная форма 379 

§ 62. Минимальный многочлен 387 

Глава четырнадцатая. Группы 392 

§ 63. Определение и примеры групп . 392 

§ 64. Подгруппы 398 

§ 65. Нормальные делители, фактор-группы, гомоморфизмы .... 404 

§ 66. Прямые суммы абелевых групп 410 

§ 67. Конечные абелевы группы 417 

Указатель литературы 425 

Предметный указатель . 427 



ПРЕДИСЛОВИЕ К ШЕСТОМУ ИЗДАНИЮ 


Первое издание этой книги вышло в 1946 г., а затем она пере- 
издавалась в 1950, 1952, 1955 и 1956 гг. Перед вторым и четвер- 
тым изданиями книга подвергалась значительной переработке, имев- 
шей целью отразить опыт алгебраического преподавания в Москов- 
ском университете. При подготовке к настоящему шестому изданию 
книга подверглась еще более серьезной переработке, столь серьез- 
ной, что с достаточными основаниями ее можно было бы считать 
новой книгой, а не шестым изданием старой книги. 

Эта переработка определялась двумя задачами. Прежде всего, 
неоднократно высказывались пожелания о расширении книги для 
того, чтобы она обеспечивала весь обязательный университетский 
курс высшей алгебры, а не только его первые два семестра, как 
это было до сих пор. С этой целью в книгу включено несколько 
новых глав. Одна из них посвящена основам теории групп, а осталь- 
ные относятся к линейной алгебре — теория линейных пространств, 
теория евклидовых пространств, теория ^-матриц и жордановой 
нормальной формы матрицы. 

Конечно, в советской алгебраической литературе в настоящее 
время имеется ряд хороших книг по линейной алгебре, различных 
по объему, содержанию, характеру изложения. Настоящая книга, 
даже после столь значительного добавления к ней материала, отно- 
сящегося к линейной алгебре, не может претендовать на замену 
какой-либо из этих книг. Тем не менее бесспорно, что студентам 
будет удобно иметь весь обязательный материал собранным в одном 
учебнике и изложенным единым стилем. 

С другой стороны, расположение глав, принятое в предшествую- 
щих изданиях книги, уже давно не соответствует действующему 
в Московском университете фактическому порядку изложения мате- 
риала — этот последний в большой мере определяется необходи- 
мостью к определенному сроку выполнять определенные заказы 
курсов аналитической геометрии и математического анализа. Больше 
того, три года тому назад в Московском университете была введена 
новая программа курса высшей алгебры. За эти годы она успешно 
прошла испытания и поэтому казалось целесообразным перестроить 
книгу, расположив в ней материал в точном соответствии с указан- 
ной программой. Появление учебника, соответствующего этой 
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программе, облегчит, вероятно, ее введение и в других универ- 
ситетах страны. 

Укажем распределение материала по семестрам: 1-й семестр — 
главы 1 — 5, 2-й семестр — главы 6 — 9, 3-й семестр — главы 10, 
11, 13 и 14. Следует отметить, что студенты-механики Московского 
университета изучают высшую алгебру лишь в объеме первых двух 
семестров. 

Несомненно, что эта перестройка книги не затруднит, а, быть 
может, даже и облегчит ее использование в педагогических инсти- 
тутах. 

Предшествующие переработки, книги удавалось выполнить без 
всякого увеличения ее объема. На этот раз сделать это было, 
конечно, невозможно. Желание в какой-то мере сократить объем 
книги заставило исключить из нее некоторый материал, в частности 
параграфы, посвященные теореме Гурвица, теории алгебр и теореме 
Фробениуса. Тем не менее не казалось разумны^ ограничиться изло- 
жением в книге лишь того материала, который входит сейчас 
в обязательную программу, -т. е. превратить эту книгу в простой 
конспект лекций. Сохраненный в книге необязательный материал — 
параграфы, целиком к нему относящиеся, отмечены звездочкой, — 
как правило, таков, что в свое время он входил в обязательную 
программу курса высшей алгебры, в некоторых университетах или 
педагогических институтах входит в программу и сейчас и во вся- 
ком случае был бы включен в программу, если бы курс высшей 
алгебры располагал ббльшим числом часов. 

При переработке книги были изменены также некоторые детали, 
на которых мы не будем, однако, сейчас останавливаться. 

А. Курош 

Москва, декабрь 1958 г. 



ВВЕДЕНИЕ 

Математическое образование студента-математика начинается с 
изучения трех основных дисциплин, а именно математического 
анализа, аналитической геометрии и высшей алгебры. Эти дисциплины 
имеют ряд точек соприкосновения, а местами и перекрытий, и вместе 
составляют фундамент, на котором строится все здание современ- 
ной математической науки. 

Высшая алгебра, изложению которой посвящена настоящая книга, 
представляет собой далеко идущее, но вполне естественное обобще- 
ние основного содержания школьного курса элементарной алгебры. 
Центральным в школьном курсе алгебры является, бесспорно, вопрос 
о решении уравнений. Как читатель помнит, изучение уравнений 
начинается с очень простого случая одного уравнения первой степени 
с одним неизвестным, а затем развивается в двух направлениях. 
С одной стороны, рассматриваются системы двух и трех уравнений 
первой степени с двумя и, соответственно, тремя неизвестными; 
с другой стороны, изучается одно квадратное уравнение с одни^і 
неизвестным, а также некоторые частные типы уравнений более 
высокой степени, легко сводящиеся к квадратным (биквадратные 
уравнения, например). 

Эти оба направления получают дальнейшее развитие в курсе 
высшей алгебры, определяя ее разбиение на два больших отдела. 
Один из них, а именно основы линейной алгебры, имеет исходной 
задачей изучение произвольных систем уравнений первой степени 
или, как говорят, линейных уравнений. Для решения таких систем 
в том случае, когда число уравнений равно числу неизвестных, раз- 
рабатывается аппарат теории определителей. Этого аппарата уже 
недостаточно, однако, для изучения таких систем линейных уравнений, 
у которых число уравнений не равно числу неизвестных, — случай, 
непривычный с точки зрения элементарной алгебры, но очень важный 
для приложений. Оказалось необходимым, в частности, разрабаты- 
вать теорию матриц, т. е. систем чисел, расположенных в квадрат- 
ные или прямоугольные таблицы из нескольких строк и столбцов. 
Эта теория оказалась очень глубокой и нашла приложения далеко 
за пределами теории систем линейных уравнений. С другой стороны, 
изучение систем линейных уравнений потребовало введения и изуче- 
ния многомерных (так называемых векторных или линейных) 
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пространств. У людей, далеких от математики, с многомерным (в пер- 
вую очередь с четырехмерным) пространством связываются туманные 
и часто ошибочные представления; в действительности же это поня- 
тие является чисто математическим, даже в основном алгебраическим, 
и служит важным орудием во многих математических исследованиях, 
а также в физике и механике. 

Вторая половина курса высшей алгебры, называемая алгеброй 
многочленов, посвящена изучению одного уравнения от одного неиз- 
вестного, но уже произвольной степени. Учитывая существование 
формулы для решения квадратных уравнений, естественно было 
искать аналогичные формулы для уравнений более высоких степеней. 
Исторически этот отдел алгебры так и развивался, причем формулы 
для решения уравнений третьей и четвертой степени были найдены 
еще в XVI веке. После этого начались безуспешные поиски формул, 
которые выражали бы корни уравнений пятой и более высоких 
степеней через коэффициенты этих уравнений при помощи радикалов, 
быть может и очень многоэтажных. Эти поиски продолжались до 
начала XIX века, когда было, наконец, доказано, что такие формулы 
не могут быть найдены и что для всех степеней, начиная с пятой, 
существуют даже конкретные примеры уравнений с целочисленными 
коэффициентами, корни которых не могут быть записаны при по- 
мощи радикалов. 

Отсутствие формул для решения уравнений высоких степеней не 
следует считать очень печальным обстоятельством — даже в случае 
уравнений третьей и четвертой степени, где такие формулы суще- 
ствуют, они очень громоздки и практически почти бесполезны. 
С другой стороны, коэффициенты тех уравнений, которые прихо- 
дится решать физикам или инженерам, являются обычно величинами, 
полученными в результате измерений, т. е. известны лишь прибли- 
женно, а поэтому и корни нужно знать лишь приближенно, с задан- 
ной точностью. Это привело к разработке различных методов при- 
ближенного решения уравнений, лишь простейшие из которых изла- 
гаются в курсе высшей алгебры. 

Центральным в алгебре многочленов оказывается, однако, не 
вопрос о практическом разыскании корней уравнений, а вопрос об 
их существовании. Известно, что существуют даже квадратные урав- 
нения с действительными коэффициентами, не имеющие действитель- 
ных корней. Пополняя запас чисел до совокупности всех комплекс- 
ных чисел, мы обнаруживаем, что квадратные уравнения уже корнями 
обладают и что это же справедливо и для уравнений третьей и 
четвертой степени, как вытекает из существования формул для их 
решения. Не найдется ли, однако, такое уравнение пятой или более 
высокой степени, которое не имеет ни одного корня даже среди 
комплексных чисел, и не придется ли для разыскания корней подоб- 
ных уравнений переходить от комплексных чисел к более широкому 
запасу чисел? Ответ на этот вопрос дает важная теорема, утвер- 
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ждающая, что всякое уравнение с любыми числовыми коэффициен- 
тами, не только действительными, но и комплексными, имеет ком- 
плексные (быть может, в частности, действительные) корни, причем 
корней этих, вообще говоря, даже столько, какова степень урав- 
нения. 

Таков краткий обзор основного содержания курса высшей алгебры. 
Следует подчеркнуть, что высшая алгебра является лишь началом 
большой алгебраической науки, очень разветвленной, богатой содер- 
жанием и постоянно развивающейся. Попытаемся дать обзор, еще 
более беглый, тех ветвей алгебры, которые в основном лежат за 
пределами курса высшей алгебры. 

Линейная алгебра, являющаяся большой наукой, посвященной 
в основном теории матриц и связанной с нею теории линейных пре- 
образований векторных пространств, включает в себя также теорию 
форм, теорию инвариантов и тензорную алгебру, играющую важную 
роль в дифференциальной геометрии. Теория векторных пространств 
получает дальнейшее развитие вне алгебры, вфункциональном анализе 
(бесконечномерные пространства). По разнообразию и значительности 
приложений как в математике, так и в механике, физике и техни- 
ческих науках линейная алгебра остается пока первой среди много- 
численных ветвей алгебры.'. 

Алгебра многочленов, развивавшаяся на протяжении многих деся- 
тилетий как наука об одном уравнении произвольной степени от 
одного неизвестного, теперь уже в основном закончена. Дальнейшее 
развитие она частично получила в некоторых разделах теории функ- 
ций комплексного переменного, в основном же переросла в теорию 
полей, о которой скажем ниже. Что же касается очень трудного 
вопроса о системах уравнений от нескольких неизвестных, но не 
линейных, а произвольных степеней, — этот вопрос, объединяющий 
оба направления, разрабатываемые в курсе высшей алгебры, в самом 
этом курсе почти не затрагивается, — то он по существу относится 
к особой ветви математики, называемой алгебраической геометрией. 

Исчерпывающее решение вопроса об условиях, при которых 
уравнение может быть решено в радикалах, было дано французским 
математиком Галуа (1811 — 1832). Его исследования указали новые 
направления в развитии алгебры, что привело уже в XX веке, после 
работ немецкой женщины-алгебраиста Э. Нбтер (1882 — 1935), к офор- 
млению новой точки зрения на задачи алгебраической науки. Сейчас 
бесспорно, что вовсе не изучение уравнений является центральной 
задачей алгебры. Истинным объектом алгебраического исследования 
следует считать алгебраические операции, подобные сложению или 
умножению чисел, но производимые, возможно, не над числами. 

Уже школьнику приходится встречаться в курсе физики с опера- 
цией сложения сил. Математические дисциплины, изучаемые на первых 
курсах университетов и педагогических институтов, приносят много- 
численные примеры алгебраических операций — сложение и умножение 
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матриц, функций, операции над преобразованиями пространства, над 
векторами и т. д. Эти операции обычно похожи на операции над 
числами и носят те же названия, но иногда некоторые свойства, 
привычные в случае чисел, оказываются утерянными. Так, очень часто 
и в очень важных случаях операции оказываются некоммутативными 
(произведение зависит от порядка сомножителей), а иногда и неассо- 
циативными (произведение трех множителей зависит от расстановки 
скобок). 

Наиболее систематическому изучению подвергаются немногие, 
наиболее важные типы алгебраических систем, т. е. множеств, соста- 
вленных из элементов какой-либо природы, для которых определены 
некоторые алгебраические операции. Таковы, в частности, поля. Это 
будут алгебраические системы, в которых, подобно системе действи- 
тельных и системе комплексных чисел, определены операции сложе- 
ния и умножения, обе коммутативные и ассоциативные, связанные 
законом дистрибутивности (т. е. справедливо обычное правило рас- 
крытия скобок) и обладающие обратными операциями — вычитанием 
и делением. Теория полей оказалась естественной областью для 
дальнейшего развития теории уравнений, а ее основные ветви — тео- 
рия полей алгебраических чисел и теория полей алгебраических 
функций — связали ее соответственно о теорией чисел и теорией 
функций комплексного переменного. Курс высшей алгебры включает 
в себя элементарное введение в теорию полей, а некоторые разделы 
курса — многочлены от нескольких неизвестных, нормальная форма 
матрицы — излагаются сразу для случая произвольного основного поля. 

Более широким, чем понятие поля, является понятие кольца. 
В отличие от случая поля, здесь уже не требуется выполнимости 
деления и, кроме того, умножение может быть некоммутативным и 
даже неассоциативным. Простейшими примерами колец служат сово- 
купность всех целых чисел (включая и отрицательные), система 
многочленов от одного неизвестного и система действительных функ- 
ций действительного переменного.Теория колец включает в себя такие 
старые ветви алгебры, как теория гиперкомплексных систем и теория 
идеалов, она связана с рядом математических наук,* в частности 
с функциональным анализом, и уже нашла некоторые выходы 
в физику. Курс высшей алгебры, по существу, содержит лишь опре- 
деление понятия кольца. 

Еще большую область применений имеет теория групп. Группой 
называется алгебраическая система с одной основной операцией, 
причем эта операция должна быть ассоциативной, хотя необязательно 
коммутативной, и должна обладать обратной операцией — делением., 
если основная операция названа умножением. Такова, например, сово- 
купность цельіх чисел, рассматриваемая относительно операции сложе- 
ния, а также совокупность положительных действительных чисел, рас- 
сматриваемая с операцией умножения. Г руппы играли большую рольуже 
в теории Галуа, в вопросе о разрешимости уравнений. в радикалах, 
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сейчас же они являются важным орудием в теории полей, во многих 
разделах геометрии, в топологии, а также и вне математики — 
в кристаллографии, в теоретической физике. Вообще, по широте 
области приложений теория групп занимает среди всех ветвей 
алгебры следующее после линейной алгебры место. Наш курс вклю- 
чает в себя главу, посвященную основам теории групп. 

В самые последние десятилетия возникла и далеко развилась 
новая область алгебры — теория структур. Структурой называется 
алгебраическая система с двумя операциями — сложением и умно- 
жением. Эти операции должны быть коммутативными и ассоциатив- 
ными, а также удовлетворять следующим требованиям: и сумма, и 
произведение элемента с самим собою должны равняться самому 
этому элементу; если сумма двух элементов равна одному из них, 
то произведение равно другому, и обратно. Примером структуры 
служит система натуральных чисел, рассматриваемая относительно 
операций взятия общего наименьшего кратного и общего наибольшего 
делителя. Теория структур имеет интересные связи с теорией групп 
и теорией колец, а также с теорией множеств; одна старая ветвь 
геометрии, а именно проективная геометрия, оказалась, по существу, 
частью теории структур; можно отметить также один выход теории 
структур в теорию электрических сетей. 

Известный параллелизм, существующий между некоторымичастями 
теории групп, теории колец и теории структур, привел к возникно- 
вению общей теории алгебраических систем (или универсальных 
алгебр). Эта теория сделала пока лишь самые первые шаги, но кон- 
туры ее уже вырисовываются, а обнаружившиеся здесь связи с мате- 
матической логикой позволяют рассчитывать на серьезное дальнейшее 
развитие. 

Конечно, в изложенную выше схему далеко не укладывается все 
многообразное содержание алгебраической науки. Существует, в част- 
ности, ряд отделов алгебры, пограничных с другими разделами мате- 
матики. Такова топологическая алгебра, изучающая алгебраические 
системы, в которых операции непрерывны относительно некоторой 
сходимости, определенной для элементов этих систем; примером 
служит система действительных чисел. К топологической алгебре 
близка теория непрерывных (или лиевых) групп, имеющая много- 
численные приложения в различных вопросах геометрии, в теорети- 
ческой физике, в гидродинамике. Впрочем, теория лиевых групп 
отличается таким переплетением алгебраических, топологических, 
геометрических и теоретико-функциональных методов, что было бы 
правильным считать ее особой ветвью математики. Существует, 
далее, теория упорядоченных алгебраических систем, возникшая 
в связи с исследованиями по основаниям геометрии и нашедшая 
приложения в функциональном анализе. Начинает развиваться, нако- 
нец, дифференциальная алгебра, устанавливающая новые связи между 
алгеброй и теорией дифференциальных уравнений. 
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Само собой разумеется, что то блестящее развитие алгебраиче- 
ской науки, которое привело к ее сегодняшнему состоянию, не было 
случайным — оно явилось частью общего развития математики и 
в значительной мере вызывалось необходимостью ответитьна запросы, 
предъявляемые к алгебре со стороны других математических наук. 
С другой стороны, развитие алгебры само оказывало и оказывает 
очень большое влияние на развитие смежных ветвей науки, осо- 
бенно усилившееся благодаря тому расширению области приложений, 
которое характерно для современной алгебры, и поэтому иногда 
говорят даже о происходящей сейчас «алгебраизации» математики. 

Обзор алгебры, данный нами выше, не только является очень 
беглым, но и не дает представления об истории развития этой науки. 
Мы закончим поэтому наше введение очень кратким обзором истории 
алгебры. 

Некоторыми вопросами алгебры, в частности решением простей- 
ших уравнений, занимались еще вавилонские, а затем древнегреческие 
математики. Вершиной алгебраических исследований этого периода 
являются сочинения греческого (александрийского) математика 
Диофанта (III век н. э.). В дальнейшем эти исследования развивались 
индийскими математиками — Ариабхата (VI век),Брамагупта (VII век), 
Бхаскара (XII век). Очень рано началась разработка вопросов алгебры 
в Китае — Чжан Цан (II век до н. э.), Цзин Чоу-чан (I век н. э.). 
Весьма крупным китайским алгебраистом был Цинь Цзю-шао (XIII век). 

Большой вклад в развитие алгебры внесли математики средне- 
векового востока, писавшие на арабском языке, в особенности уро- 
женцы Средней Азии узбекский ученый Мухаммед Аль-Хорезми 
(IX век) и таджикский математик и поэт Омар Хайям (1040 — 1123). 
В частности, само слово «алгебра» возникло в связи с заглавием 
книги Аль-Хорезми «Аль-джебр аль-мукабала». 

Упомянутые выше исследования вавилонских, греческих, индий- 
ских, китайских и среднеазиатских алгебраистов относились к тем 
вопросам алгебры, которые входят ныне в программу курса элемен- 
тарной алгебры, и лишь иногда касались уравнений третьей степени. 
В этом же круге вопросов оставались в основном и исследования 
средневековых западноевропейских алгебраистов и алгебраистов эпо- 
хи Возрождения; назовем итальянского математика Леонардо Пизан- 
ского (Фибоначчи) (XII век) и создателя современной алгебраической 
символики француза Вьета (1540 — 1603). Впрочем, выше уже отме- 
чалось, что в XVI веке были найдены методы решения уравнений 
третьей и четвертой степени; здесь должны быть названы имена 
итальянцев Ферро (1465 — 1526), Тарталья (1500 — 1557), Кардано 
(1501 — 1576) и Феррари (1522 — 1565). 

В XVII и XVII 1 веках происходила интенсивная разработка общей 
теории уравнений (т.. е. алгебры многочленов), в которой прини- 
мали участие крупнейшие ученые того времени — француз Декарт 
(1596 — 1650), англичанин Ньютон (1643 — 1727), французы Даламбер 
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(1717 — 1783) и Лагранж (1736 — 1813). В XVIII веке началось также 
построение теории определителей — швейцарский математик Крамер 
(1704 — 1752), французский ученый Лаплас (1749 — 1827). На рубеже 
XVIII и XIX веков немецкий математик Гаусс (1777 — 1855) доказал 
упоминавшуюся выше основную теорему о существовании корней 
уравнений с числовыми коэффициентами. 

Первая треть XIX века ознаменована в истории алгебры решением 
проблемы о разрешимости уравнений в радикалах. Доказательство 
невозможности найти формулы для решения уравнений, степень 
которых больше или равна пяти, было получено итальянским мате- 
матиком Руффини (1765 — 1822) и в более строгой форме норвежским 
ученым Абелем (1802 — 1829). Как уже отмечалось выше, исчерпы- 
вающее решение вопроса об условиях, при которых уравнение допу- 
скает решение в радикалах, принадлежит Галуа. 

Теория Галуа явилась толчком для широкого развития алгебры 
в середине и второй половине XIX века, в том числе и новых ее 
направлений. Так, появились теория полей алгебраических чисел и 
полей алгебраических функций и связанная с ней теория идеалов. 
Здесь нужно назвать немецких математиков Куммера (1810— 1893), 
Кронекера (1823 — 1891) и Дедекинда (1831 — 1916) и русских мате- 
матиков Е. И. Золотарева (1847 — 1878) и Г. Ф. Вороного (1868 — 1908). 
Большое развитие получила теория конечных групп, идущая еще от 
Л агранжа и Галуа; здесь работали французы Коши (1789 — 1857) и 
Жордан (1838 — 1922), норвежский математик Силов (1832 — 1918), 
немецкиеалгебраистыФробениус(1849 — 1918)иГёльдер(1859 — 1937). 
Начало теории непрерывных групп положили исследования норвеж- 
ского математика С. Ли (1842 — 1899). 

Работами английского ученого Гамильтона (1805 — 1865) и немец- 
кого математика Грасмана (1809 — 1877) началась теория гиперком- 
плексных систем или, как теперь говорят, теория алгебр. Большую 
роль в дальнейшем развитии этой ветви алгебры играли относя- 
щиеся к концу века работы русского математика Ф. Э. Молина 
(1861 — 1941). 

Линейная алгебра достигла в XIX веке большого расцвета, 
прежде всего благодаря работам английских математиков Сильвестра 
(1814 — 1897) и Кэли (1821 — 1895). Продолжалась разработка и 
алгебры многочленов; мы отметим лишь метод приближенного реше- 
ния уравнений, найденный русским геометром Н. И. Лобачевским 
(1792—1856), и работы немецкого математика Гурвица(1859 — 1919). 
Во второй полови не века начала создаваться алгебраическая геометрия, 
в частности в работах немецкого математика М. Нётера (1844 — 1922). 

В XX веке алгебраические исследования приобрели очень большую 
широту и алгебра, как мы уже знаем, заняла в математике весьма 
почетное место. В этот период возникают многие новые разделы 
алгебры, в том числе общая теория полей (десятые годы), теория 
колец и общая теория групп (двадцатые годы), топологическая 
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алгебра и теория структур (тридцатые годы); в сороковых и пяти- 
десятых годах появились теория полугрупп и теория квазигрупп, 
теория универсальных алгебр, гомологическая алгебра, теория кате- 
горий. Во всех частях алгебры работают крупные ученые, внесшие 
серьезный вклад в науку, в ряде стран возникают большие алгебраи- 
ческие школы. Это относится, в частности, к Советскому Союзу. 

Из числа русских дореволюционных алгебраистов, помимо назван- 
ных выше, следует указать также С. О. Шатуновского (1859 — 1929) 
и Д. А. Граве (1863 — 1939). Однако настоящий расцвет алгебраи- 
ческих исследований в нашей стране начинается лишь после Великой 
Октябрьской революции. Эти исследования захватывают почти все 
разделы современной алгебраической науки, причем в некоторых из 
них работы советских алгебраистов играют руководящую роль. Мы 
назовем лишь два имени — Н. Г. Чеботарева (1894 — 1947), рабо- 
тавшего в теории полей и теории лиевых групп, и О. Ю. Шмидта 
(1891 — 1956), известного полярника и в то же время крупного 
алгебраиста, создателя советской теоретико-групповой школы. 

Заканчивая наш краткий обзор современного состояния и путей 
развития алгебры, мы должны еще раз подчеркнуть, что рассмотрен- 
ные здесь вопросы в основном лежат за пределами курса высшей 
алгебры. Задачей обзора было лишь помочь читателю получить 
правильное представление о месте, занимаемом курсом высшей алгебры 
в алгебраической науке в целом и во всем большом здании мате- 
матики. 



ГЛАВА ПЕРВАЯ 

СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. ОПРЕДЕЛИТЕЛИ 

§ 1. Метод последовательного исключения неизвестных 

Мы начинаем курс высшей алгебры с изучения систем уравнений 
первой степени с несколькими неизвестными или, как обычно гово- 
рят, систем линейных уравнений 1 ). 

Теория систем линейных уравнений кладет начало большому 
и важному отделу алгебры — линейной алгебре, — к которому отно- 
сится большая часть глав нашей книги, в частности ее первые три 
главы. Коэффициенты уравнений, рассматриваемых в этих трех гла- 
вах, значения неизвестных и вообще все числа, с которыми мы 
будем встречаться, следует считать действительными. Впрочем, все 
содержание этих глав дословно переносится и на случай произволь- 
ных комплексных чисел, уже известных читателю из курса средней 
школы. 

В отличие от элементарной алгебры мы будем изучать системы 
с произвольным числом уравнений и неизвестных, причем иногда 
число уравнений системы не будет даже предполагаться совпадаю- 
щим с числом неизвестных. Пусть нам дана система из $ линейных 
уравнений с п неизвестными. Условимся употреблять следующую 
символику: неизвестные мы будем обозначать буквой х с индексами: 
х ѵ х 2 , ...,х п ; уравнения будем считать перенумерованными — пер- 
вое, второе, . . . , 5-е; коэффициент из /-го уравнения при неиз- 
вестном X] обозначим через а,-. 2 ); наконец, свободный член і - го 
уравнения обозначим через 


’) Это название связано с тем, что в аналитической геометрии уравне- 
ние первой степени с двумя неизвестными определяет прямую линию на 
плоскости. 

2 ) Мы употребляем, следовательно, два индекса, из которых первый ука- 
зывает на номер уравнения, второй— -на номер неизвестного. Для сокраще- 
ния письма эти индексы не разделяются запятой; не следует, однако, в слу- 
чае а и вместо «а один один» читать «а одиннадцать», в случае а 34 вместо 
«а три четыре» читать «а тридцать четыре». 
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Наша система запишется теперь в следующем общем виде: 

“Ь ^12-^2 Ч" + а 1п Х п~&1> 

^2X^1 Ч" ®22-^2 Ч" • • • Ч" ®2п ~ 


'I- ®$2^2 Ч" • * • "1"" ^зп^п 

Коэффициенты при неизвестных составляют прямоугольную таб- 
лицу 

а \\ а ѴІ • • • а 1л\ 

••• «2„ \ (2) 
• &$п / 

называемую матрицей из 5 строк и п столбцов ; числа а, у назы- 
ваются элементами матрицы 1 ). Если 8 = п (т. е. число строк равно 
числу столбцов), то матрица называется ' квадратной матрицей 
порядка п. Диагональ этой матрицы, идущая от левого верхнего 
к первому нижнему углу (т. е. составленная из элементов а п , а 22 , . . . 

. . . , а пн ), называется главной диагональю. Квадратная матрица 
порядка п будет называться единичной матрицей порядка п , если 
все элементы ее главной диагонали равны единице, а все элементы 
вне этой диагонали равны нулю. 

Решением системы линейных уравнений (1) называется такая 
система п чисел к ѵ к 2 , ..., к п , что каждое из уравнений (^обра- 
щается в тождество после замены в нем неизвестных лг,- соответ- 
ствующими числами к і, і— 1 , 2, ..., л 2 ). 

Система линейных уравнений может не иметь ни одного реше- 
ния и тогда она называется несовместной. Такова, например, си- 
стема 

+ 5*2 = 1 . 

Хх -р- 5х 2 = 7: 

левые части этих уравнений совпадают, но правые различны, и по- 
этому никакая система значений неизвестных не может удовлетво- 
рить обоим уравнениям сразу. 

Если же система линейных уравнений обладает решениями, то 
она называется совместной. Совместная система называется опре- 
деленной , если она обладает одним-единственным решением — лишь 
такие системы допускаются к рассмотрению в элементарной алгебре,— 



1) Таким образом, если матрицу (2) рассматривать вне связи с систе- 
мой (1), то первый индекс элемента а,-.- указывает на номер строки, вто- 
рой — на номер столбца, на пересечении которых этот элемент стоит. 

2 ) Подчеркиваем, что числа /г,, к 2 , . . . , к п составляют одно решение 
системы, а не л решений. 
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и неопределенной, если решений больше чем одно; как мы узнаем 
позже, их будет в этом случае даже бесконечно много. Так, система 

*і + 2* 2 = 7, 1 

*1 4 -* 2= 4 / 

определенна: она имеет решение х г —\, * 2 = 3 и, как легко про- 
веряется методом исключения неизвестного, это решение будет един- 
ственным. С другой стороны, система 

3*1 *2 == 1 1 1 

6 ^ — 2* 2 = 2 ) 

неопределенна, так как имеет бесконечно много решений вида 

*! = &, * 2 = 3 к — 1, (3) 

где число к произвольно, причем решениями, получающимися по 
формулам (3), исчерпываются все решения нашей системы. 

Задача теории систем линейных уравнений состоит в разработке 
методов, позволяющих узнать, совместна ли данная система уравне- 
ний или нет, в случае совместности установить число решений, 
а также указать способ найти все эти решения. 

Мы начнем с метода, наиболее удобного для практического разы- 
скания решений систем с числовыми коэффициентами, а именно ме- 
тода последовательного исключения неизвестных или метода 
Гаусса. 

Вначале одно предварительное замечание. Нам придется делать 
дальше такие преобразования системы линейных уравнений: обе 
части одного из уравнений системы, умноженные на одно и то же 
число, вычитать из соответствующих частей некоторого другого 
уравнения системы. Пусть для определенности мы обе части первого 
уравнения системы (1), умноженные на число с, вычитаем из соот- 
ветствующих частей второго уравнения. Мы получим новую систему 
линейных уравнений: 

а 11 Х 1 а 12 Х 2 ••• ~Ь а 1п Х п = ^1> 

а 2 і*і а 2 2 х 2 Н"" • • - ®2п Х п == ^2 , 

^32^2 “I” ®Зп Х п == ^3> І ^ 

а іі х і "4* а з2 Х 2 • “Ь а $п Х п =: 
где 

с 2 / = а 2 у — са і] при у=1, 2, п, Ь 2 = Ь 2 — сЬ 1 . 

Системы уравнений (1) и (4) эквивалентны, т. е. они или 
обе несовместны, или же обе совместны и обладают одними и 
теми же решениями. В самом деле, пусть А 1 , к 2 , . . . , к п будет 
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произвольное решение системы (1). Эти числа удовлетворяют, оче- 
видно, всем уравнениям системы (4), кроме второго. Они удовле- 
творяют, однако, и второму уравнению системы (4) — достаточно 
вспомнить, как это уравнение выражается через второе и первое 
уравнения системы (1). Обратно, всякое решение системы (4) будет 
удовлетворять и системе (1). Действительно, второе уравнение си- 
стемы (1) получается вычитанием из обеих частей второго уравнения 
системы (4) соответствующих частей первого уравнения этой си- 
стемы, умноженных на число — с. 

Понятно, что если к системе (іу будут несколько раз при- 
менены преобразования рассмотренного типа, то вновь полу- 
ченная система уравнений останется эквивалентной исходной си- 
стеме (1). 

Может случиться, что после выполнения таких преобразований 
в нашей системе появится уравнение, все коэффициенты левой части 
которого равны нулю. Если и свободный член этого уравнения равен 
нулю, то уравнение удовлетворяется при любых значениях неизвест- 
ных, и поэтому, отбрасывая это уравнение, мы придем к системе 
уравнений, эквивалентной' исходной системе. Если же свободный 
член рассматриваемого уравнения отличен от нуля, то это уравнение 
не может удовлетворяться ни при каких значениях неизвестных, 
а поэтому полученная нами система уравнений, равно , как и эк- 
вивалентная ей исходная система, будут несовместными. 

Перейдем теперь к изложению метода Гаусса. 

Пусть дана произвольная система линейных уравнений (1). Поло- 
жим, для определенности, что коэффициент а 11 ^=0, хотя на самом 
деле он может, конечно, оказаться равным нулю, и мы должны будем 
начать с какого-либо другого, отличного от нуля, коэффициента 
из первого уравнения системы. 

Преобразуем теперь систему (1), исключая неизвестное х х из всех 
уравнений, кроме первого. Для этого обе части первого уравнения 

умножим на число — и вычтем из соответствующих частей второго 
а и • 

уравнения, затем обе части первого уравнения, умноженные на 

число — , вычтем из соответствующих частей третьего уравнения, 
а п 

и т. д. 

Мы придем этим путем к новой системе из 5 линейных уравне- 
ний с п неизвестными: 

®11*1 "1“ ^12-^2 «13*3 • ■ • ”Ь «1п*п ^1> } 

«22*2 ~І~ «23*3 ^"2 Я*п ^2, 

032*2 + «33*3 + . . . ■+■ а зп Х п —Ь 3 , 


( 5 ) 
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Нам нет необходимости явно записывать выражения новых коэффи- 
циентов ац и новых свободных членов Ь{ через коэффициенты и 
свободные члены исходной системы (1). 

Как мы знаем, система уравнений (5) эквивалентна системе (1). 
Будем преобразовывать теперь систему (5). При этом первое урав- 
нение мы не будем больше трогать совсем и подлежащей пре- 
образованиям будем считать лишь часть системы (5), состоящую 
из всех уравнений, кроме первого. При этом мы считаем, конечно, 
что среди этих уравнений нет таких, все коэффициенты левых частей 
которых равны нулю, — такие уравнения мы выбросили бы, если бы 
и их свободные члеНы были равны нулю, а в противном случае мы 
уже доказали бы несовместность нашей системы. Таким образом, 
среди коэффициентов ац есть отличные от нуля; для определенности 
примем, что а гі =/= 0. Преобразуем теперь систему (5), вычитая из 
обеих частей третьего и каждого из следующих уравнений обе части 
второго уравнения, умноженные соответственно на числа 


Этим будет исключено неизвестное х 2 из всех уравнений, кроме пер- 
вого и второго, и мы придем к следующей системе уравнений, экви- 
валентной системе (5), а поэтому и системе (1): 

а и х і + а \г х 2 + «13*3 + • • • + «іА 
а гг х г ~Ь а гз х з “Ь ••• "Ь а гп х п 

^зз-^з^Ь ••• ~Ь а зпХ п 


а 1з х з~\~ ••• ~\~ а 1п х п — 

Наша система содержит теперь і уравнений, так как некото- 

рые уравнения оказались, возможно, отброшенными. Понятно, что 
число уравнений системы могло уменьшиться уже после исключе- 
ния неизвестного х х . В дальнейшем подлежит преобразованиям лишь 
часть полученной системы, содержащая все уравнения, кроме двух 
первых. 

Когда остановится этот процесс последовательного исключения 
неизвестных? 

Если мы придем к такой системе, одно из уравнений которой 
имеет отличный от нуля свободный член, а все коэффициенты левой 
части равны нулю, то, как мы знаем, наша Исходная система не- 
совместна. 
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В противном случае мы получим следующую систему уравнений, 
эквивалентную системе (1): 


#11*1 + #12*2 + • • • + # 1 , + #іа*А"Ь • • • + #1л*л — ^ 1 . 

#2 2*2 ~Г" • • * “Ь #2,&- 1*А- 1 "Г" #2 к Х к “Ь • • . 4* #2 Л*л ^ ^2> 

„(*-«) у I п ( к -ъ) у | ,„(*-*) ѵ 

#6-1,6-1*й-1 ~Г #6-1. *** + • • • “Г #4-1, л* л — #6-1 > 


#66 1 '*А+ . . • + #4л 


(6-1) 


ь'і 


,( 6 - 1 ) 


( 6 ) 


Здесь а г1 фО, а гг =/= 0, . . . , а^к-\!к~г ^ 0> #1б _1): ^О. Отметим так- 
же, что и, очевидно, к^п. 

В этом случае система (1) совместная. Она будет опреде- 
ленной при к = п и неопределенной при к<іп. 

Действительно, если к = п, то система (6) имеет вид 


# 11*1 + # 12*2 + 
#22*2 ~Ь 


+ #1л*л — 

/ 1 / 

+ #2Л*л — ^2. 


г пп •*_ — и„ 


( 7 ) 


Из последнего уравнения мы получаем вполне определенное значение 
для неизвестного х п . Подставляя его в предпоследнее уравнение, мы 
найдем однозначно определенное значение для неизвестного х п _ г . 
Продолжая так далее, мы найдем, что система (7), а поэто_му и 
система (1), обладают единственным решением, т. е. совместны и 
определенны. 

Если же к<іп, то для «свободных» неизвестных а' і+1 , . . . , х п 
мы возьмем произвольные числовые значения, после чего, двигаясь 
по системе (6) снизу вверх, мы, как и выше, найдем для неизвест- 
ных х к , х к _ ъ . . . , дг 2 , лг г вполне определенные значения. Так как 
значения для свободных неизвестных можно выбрать бесконечным 
числом различных способов, то наша система (6) и, следовательно, 
система (1) будут совместными, но неопределенными. Легко прове- 
рить, что указанным здесь методом (при всевозможных выборах 
значений для свободных неизвестных) будут найдены все решения 
системы (1). 

В первый момент кажется возможным еще один вид, к которому 
может приводиться система линейных уравнений методом Гаусса, 
а именно вид, получающийся приписыванием к системе (7) еще не- 
скольких уравнений, содержащих лишь неизвестное х п . В действи- 
тельности, однако, в этом случае преобразования просто не доведены 
до конца: так как 0, то из всех уравнений, начиная 

с (л+1)-го, неизвестное х п может быть исключено. 

Следует заметить, что «треугольная» форма системы уравнений 
(7) или «трапецоидальная» форма системы уравнений (6) (при Ь<п) 
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получилась ввиду предположения, что коэффициенты о 11 , а 23 и т. л. 
отличны от нуля. В общем случае та система уравнений, к которой 
мы придем после доведения до конца процесса исключения неизве- 
стных, приобретет треугольную или трапецоидальную форму лишь 
после надлежащего изменения нумерации неизвестных. 

Суммируя все изложенное выше, мы получаем, что метод Гаусса 
применим к любой системе линейных уравнений. При этом си- 
стема будет несовместной, если в процессе преобразований мы 
получим уравнение, в котором коэффициенты при всех неизве- 
стных равны нулю, а свободный член отличен от нуля.-, если же 
мы такого уравнения не встретим , то система будет совмест- 
ной. Совместная система уравнений будет определенной, если 
она приводится к треугольному виду (7), и неопределенной , если 
приводится к трапецоид а льно му виду (6) при к<Сп. 

Применим сказанное к случаю системы линейных однородных 
уравнений, т. е. уравнений, свободные члены которых равны нулю. 
Такая система всегда совместна, так как обладает нулевым реше- 
нием (0, 0, . , . , 0). Пусть в рассматриваемой системе число урав- 
нений меньше числа неизвестных. Тогда наша система не может 
приводиться к треугольному виду, так как в процессе преобразо- 
ваний по методу Г аусса число уравнений системы может уменьшаться, 
но не может увеличиваться; она приводится, следовательно, к тра- 
пецеидальному виду, т. е. неопределенна. 

Иными словами, если в системе линейных однородных урав- 
нений число уравнений меньше числа неизвестных, то эта си- 
стема обладает, помимо нулевого решения, также и ненуле- 
выми решениями, т. е. решениями, в которых значения некоторых 
(или даже всех) неизвестных отличны от нуля; таких решений 
будет бесконечно много. 

При практическом решении системы линейных уравнений мето- 
дом Гаусса следует выписать матрицу' из коэффициентов системы, 
присоединить к ней столбец из свободных членов, для удобства отде- 
ленный вертикальной чертой, и все преобразования выполнять над 
строками этой «расширенной» матрицы. 

Примеры. 1. Решить систему. 

•*і + 2* 2 Ъх 3 = — 9, 1 

*і— х 2 +3* 3 = 2, ) 

3*1 — 6,ѵ 2 — х 3 = 25. I 

Подвергаем преобразованиям расширенную матрицу этой системы: 

/1 2 5 -9ч /1 2 5 -9ч /1 2 5 - 9ч 

(1—1 3 2 ) — *- (О — 3 — 2 111— ► (О —3 —2 11). 

\3 —6 —1 25/ \0 —12 —16 52/ \0 0 —8 8/ 
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Мы приходим, следовательно, к системе уравнений 

Хд -{- 2я 2 + 5х 3 = — 9, 

— За,— 2х 3 = 11, I 
— 8х 3 = 8, ) 

обладающей единственным решением 

Хд=2, х а = — 3, х 3 = — 1. 

Исходная система оказалась определенной. 

2. Решить систему 

Хд — Бх а — 8х 3 + х 4 = 3, 

Зхд + “ Зх 3 ■ За і — 1, 

Хд — 7х 3 + 2х 4 = — 5, 
11х а -{-20х 3 — 9х 4 = 2. 1 

Преобразуем расширенную матрицу системы: 



Мы пришли к системе, содержащей уравнение 0 = 2. Исходная система будет, 
следовательно, несовместной. 

3. Решить систему 


4*1+ х а — Зх 3 — х 4 = 0, ^ 

2х і + Зх а + ,ѵ 3 — 5х 4 = 0, I 
х 4 — 2х а — 2х 3 -}-Зх 4 = 0. ) 

Это система однородных уравнений, причем число уравнений меньше 
числа неизвестных; она должна быть поэтому неопределенной. Так как все 
свободные члены равны нулю, то мы будем подвергать преобразованиям 
лишь матрицу из коэффициентов системы: 

/4 1 —3 —К /0 9 5 — 13ч /0 ' 2 0 — 2\ 

2 3 1 —5 ] — >■ ( 0 7 5 —11)— э- 0 7 § — 11). 

\1 —2 —2 3/ \1 —2 —2 3/ \1 —2 -2 зУ 

Мы пришли к системе уравнений 

2х а — 2х 4 = 0, \ 

7х а + 5х 3 — 11х 4 = 0, | 

Хд — 2х а — 2х 3 + 3х 4 = 0. ) 

В качестве свободного неизвестного можно принять любое из неизвестных хг 
и х 4 . Пусть х 4 = а. Тогда из первого уравнения следует х а = а, после чего 
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4 

из второго уравнения получаем х 3 =-=-а и, наконец, из третьего уравнения 

и 

*!=-=- а. Таким образом, 

О 

3 4 

у а, а, у а, а 

будет общий вид решений заданной системы уравнений. 


§ 2. Определители второго и третьего порядков 

Метод решения системы линейных уравнений, изложенный в пред- 
шествующем параграфе, весьма прост и требует выполнения одно- 
типных вычислений, легко осуществляемых на счетных машинах. Его 
существенным недостатком является, однако, то, что он не дает воз- 
можности сформулировать условия совместности или определенности 
системы при помощи коэффициентов и свободных членов этой 
системы. С другой стороны, даже в случае определенной системы 
этот метод не позволяет найти формулы, выражающие решение 
системы через ее коэффициенты и свободные члены. Все это ока- 
зывается, однако, необходимым в разных теоретических вопросах, 
в частности, в геометрических исследованиях, а поэтому теорию 
систем линейных уравнений приходится развивать иными методами, 
более глубокими. Общий случай будет рассмотрен в следующей 
главе, а дальнейшее содержание настоящей главы посвящается слу- 
чаю определенных систем, имеющих равное число уравнений и не- 
известных, приием мы начнем с уже изучавшихся в элементарной 
алгебре систем с двумя и тремя неизвестными. 

Пусть дана система двух линейных уравнений с двумя неиз- 
вестными 

а і1 Х 1 ~Г а 12*2 = ^1>. | 

^21 Х 1 “Ь ® 2 2 Х 2 ~ ^2’ і 


коэффициенты которой составляют квадратную матрицу второго 
порядка 

(“" “”)• (2) 

\ а 21 а 22/ 

Применяя к системе (1) метод уравнивания коэффициентов, мы 
получим: 

( а ц а 22 а і2 а 2і) -^1 = ^ 1 а 23 
(®ц®22 а і2 а -2і) Х 2 ~ ® 11^2 ^ 1 ^ 21 ’ 


Предположим, что а 11 а 22 — а 12 а 21 Ф0. Тогда 




^ 1 ^ 22 — аіФг 
°и а 22 -_а 12°21 ’ 


Х 2 


а 11^2 ^1 а 21 


°11 а 22 Я 12°21 


( 3 ) 
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Легко проверить, подставляя полученные значения неизвестных в урав- 
нения (1), что (3) служит решением для системы (1); вопрос о един- 
ственности этого решения будет рассматриваться в § 7. 

Общий знаменатель значений неизвестных (3) очень просто выра- 
жается через элементы матрицы (2): он равен произведению элемен- 
тов главной диагонали минус произведение элементов второй диаго- 
нали. Это число называется определителем (или детерминантом ) 
матрицы (2), причем, как говорят, определителем второго порядка, 
так как матрица (2) есть матрица второго порядка. Для обозначения 
определителя матрицы (2) употребляется следующий символ: выпи- 
сывается матрица (2), но заключается вместо круглых скобок в пря- 
мые черточки; таким образом, 


Примеры. 

1 ) 

2 ) 


а і 


О 22 


^11^22 ® 12 а 2 


3 

1 

1 

3 


= 3.4— 7-1=5; 

5 I 

= 1 -5 — (— 2)-3 = 11. 


(4) 


Следует еще раз подчеркнуть, что в то время как матрица есть 
таблица из чисел, определитель есть число, вполне определенным 
образом связанное с квадратной матрицей. Заметим, что произведе- 
ния а 1Х а 22 и а іг а 21 называются членами определителя второго порядка. 

Числители выражений (3) имеют такой же вид, как и знаменатель, 
т. е. также являются определителями второго порядка: числитель 
выражения для х г является определителем матрицы, получающейся 
из матрицы (2) заменой ее первого столбца столбцом из свободных 
членов системы (1), числитель выражения для х 2 есть определители 
матрицы, получающейся из матрицы (2) такой же заменой ее вто- 
рого столбца. Формулы (3) теперь можно записать в следующем 
виде: 


Ь х а и 


а и 

О 22 

у л 

Я 21 


, X 2 — 


а 11 а 12 


а 1 1 °12 

^21 а 22 


а П °22 


Словами это правило решения системы двух линейных уравнений 
с двумя неизвестными (называемое правилом Крамера ) формули- 
руется следующим образом: 

Если определитель (4) из коэффициентов системы уравнений (1) 
отличен от нуля, то мы получим решение системы (1), беря 
в качестве значений для неизвестных дроби, общим знаменателем 
которых служит определитель (4), о числителем для неизвест- 
ного х ( (1=1,2) является определитель, получающийся заменой 
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в определителе (4) і-го столбца ( т . е. столбца коэффициентов 
при искомом неизвестном) столбцом из свободных членов си- 
стемы (I) 1 ). 


Пример. Решить систему 

2*і + х г = 7, * 

— Зх 2 = — 2. / 

Определитель из коэффициентов есть 



он отличен от нуля, и поэтому к системе применимо правило Крамера. 
Числителями для неизвестных будут определители 



Таким образом, решением нашей системы служит следующая система чисел: 



Введение определителей второго порядка не вносит существен- 
ных упрощений в решение систем двух линейных уравнений с двумя 
неизвестными, и без этого не представляющее никаких трудностей. 
Аналогичные методы для случая систем трех линейных уравнений 
с тремя неизвестными оказываются уже практически полезными. 
Пусть дана система 


а іІ Х 1~Ф а 12 Х гФ~ а 13 Х 3~ ^1' ^ 

а і3 х 3 = Ь 2 , > 

а З\ Х 1 а 32*2 "Ь а 33-*"3 ~ ^з ] 


с матрицей из коэффициентов 



( 6 ) 


( 7 ) 


Если мы умножим обе части первого из уравнений (6) на число 
а 22 а зз — а гз а з 2 > °б е части второго уравнения на а 13 а 32 — а 12 а 33 , обе 
части третьего на а іг а 23 — а 13 а 22 , а затем сложим все три уравнения, 
то, как легко проверить, коэффициенты при х г и х 3 окажутся 


1 ) Мы в этой формулировке для краткости говорим о замене столбцов 
«в определителе». Подобным же образом и в будущем мы будем говорить, 
если это будет удобнее, о строках и столбцах определителя, о его элемен- 
тах, диагоналях и т. д. 
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равными нулю, т. е. эти неизвестные одновременно исключаются, и 
мы получим равенство 

( й 11 а 22 а 33 ~Ь й 12 а 23 а 31 а 13 а 21 й 32 а іЗ а 22 й ЗІ а і2 а 2і а 33 ’ 

^Х1^23 а 32) % і — ^1^22 а зЗ “Ь ^12^23^3 "Ь а 13^2 а 32 а 13 а 22^3 

Йі2&2 а 33 ^1 а 23 а 32- (8) 

Коэффициент при х х в этом равенстве называется определителем 
третьего порядка, соответствующим матрице (7). Для его записи 
употребляется такая же символика, как и в случае определителей 
второго порядка; таким образом, 

а и а і2 а із 

а 21 а 22 а 23 = й 11 а 22 а 33 “Ь + а 13 а 21 а 32 ' 

а 31 а з2 а 33 а 13 а 22 а 31 а 12 а 2х а 33 ^ЧІ^гЗ^зг 1 (9) 

Хотя выражение определителя третьего порядка является доста- 
точно громоздким, закон его составления из-влементов матрицы (7) 
оказывается весьма простым. В самом деле, один из трех членов 
определителя, входящих в его выражение (9) со знаком плюс, будет 
произведением элементов главной диагонали, каждый из двух дру- 
гих — произведением элементов, лежащих на параллели к этой диа- 
гонали, с добавлением третьего множителя из противоположного угла 
матрицы. Члены, входяхцие в (9)со знаком минус, строятся таким же 
образом, но относительно второй диагонали. Мы получаем способ 
вычисления определителей третьего порядка, приводящий (при нали- 
чии некоторой тренировки) весьма быстро к результату. На рис. 1 

+ 


Рис. 1. 



слева схематически указано правило вычисления положительных чле- 
нов определителя третьего порядка, справа — правило вычисления 
его отрицательных членов. 


Примеры. 

1) 


2 1 
—4 3 
2 3 


2 

1 = 2-3-5 + Ы.2 + 2-(— 4)-3— 

5 — 2-3-2 — 1 •( — 4) -5 — 2-1 -3 = 

= 30 + 2—24—12 + 20—6=10. 


2) 



О’ -5 
3 2 

-2 0 


= 1-3 0 + 0-2.1+ (— 5) • (—2) • (—2) — 

— { — 5)-3-1 — 0- (—2) -О— 1-2- (—2) = 
= —20+15 + 4 = — !. 
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Правая часть равенства (8) также будет определителем третьего 
порядка, а именно определителем матрицы, получающейся из ма- 
трицы (7) заменой ее первого столбца столбцом из свободных членов 
системы (6). Если мы обозначим определитель (9) буквой й, а опре- 
делитель, получающийся заменой его ]- го столбца (у = 1 , 2, 3) 
столбцом из свободных членов системы (6), символом то равен- 
ство (8) приобретет вид йх^ — йу, откуда при йф§ следует 


*1 = 


<к 

а • 


( 10 ) 


Таким же путем, умножая уравнения (6) соответственно на числа 

а 23^31 а 21 а 33і ^11^33 а 13 а 31’ а 13^21 а 11^28> МЫ ПОЛуЧИМ ДЛЯ х 2 

следующее выражение (снова при йф 0): 



(П) 


Наконец, умножая эти уравнения соответственно на я 21 а 32 — а 22 я 31 , 
я 12 а 81 — я Х1 я 32 , а хі а 22 — я 12 а 21 , мы придем к выражению для лг 3 : 


х 3 



( 12 ) 


Подставляя выражения (10) — (12) в уравнения (6) (предполагается, 
понятно, что определители й и все й] записаны в развернутом виде), 
мы получили бы после громоздких, но вполне доступных читателю 
вычислений, что все эти уравнения удовлетворяются, т. е. что числа 
(10) — (12) составляют решение системы (6). Таким образом, если 
определитель из коэффициентов системы трех линейных уравне- 
ний с тремя неизвестными отличен от нуля, то решение этой 
системы может быть найдено по правилу Крамера, формули- 
руемому так же, как и в случае системы двух уравнений. Дру- 
гое доказательство этого утверждения (не опирающееся на опущен- 
ные нами вычисления), а также доказательство единственности реше- 
ния (10) — (12) системы (6), притом для более общего случая, 
читатель найдет в § 7. 

Пример. Решить систему: 


2х г — х 2 + х 3 = 0, і 
Зх 1 + 2х 2 —5х в =1, > 
х 1 + 3х: 2 — 2дг 3 = 4. 1 


Определитель из коэффициентов системы отличен от нуля: 




СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. ОПРЕДЕЛИТЕЛИ 


28 


Гг л. 1 


поэтому к системе применимо правило Крамера. Числителями для неизвест- 
ных будут определители 


0 —1 1 


2 0 1 

1 2 —5 

= 13, а г = 

3 1 —5 

4 3—2 

' 

1 4 —2 


<*я = 


2—10 
3 2 1 

1 3 4 


= 21 , 


т. е. решением системы служит система чисел 


_13 __47' _2|__3 

* 1_ 28’ — 28’ * а_ 28 - 4 ' 


§ 8. Перестановки и подстановки 

Для определения и изучения определителей порядка л нам будут 
нужны некоторые понятия и факты, относящиеся к конечным мно- 
жествам. Пусть дано некоторое конечное множество М, состоящее 
из л элементов. Эти элементы могут быть перенумерованы при по- 
мощи первых л натуральных чисел 1, 2, л, и так как в инте- 
ресующих нас вопросах индивидуальные свойства элементов мно- 
жества М не будут играть никакой роли, то мы просто примем, 
что элементами М служат сами эти числа 1, 2, . .., л. 

Помимо употребляющегося нами расположения чисел 1,2, . . ., л 
в их нормальном порядке, их можно упорядочить и многими дру- 
гими способами. Так, числа 1, 2, 3', 4 можно расположить также 
следующими способами: 3,1, 2, 4 или 2, 4, 1, 3 и т. д. Всякое 
расположение чисел 1, 2, яв некотором определенном порядке 
называется перестановкой из п чисел (или из п символов). 

Число различных перестановок из п символов равно произве- 
дению 1*2... п, обозначаемому л! (читается: «эн-факториал»). Дей- 
ствительно, общий вид перестановки из п символов есть і г ,і 2 , • . . , і п , 
где каждое из і 5 есть одно из чисел 1, 2, ..., п, причем ни одно 
из этих чисел не встречается дважды. В качестве г\ можно взять 
любое из чисел 1 , 2, ..., л; это дает л различных в-озможностей: 
Если, однако, / г уже выбрано, то в качестве і г можно взять лишь 
одно из оставшихся л — 1 чисел, т. е. число различных способов 
выбрать символы і г и і 2 равно произведению л(л— 1) и т. д. 

Таким образом, число перестановок из Л символов при п— 2 
равно 2! = 2 (перестановки 12 и 21; мы не будем в примерах, где 
л ^9, разделять переставляемые символы запятьіми); при л = 3 это 
число равно 3! = 6, при л = 4 оно равно 41 = 24. Далее, с ростом п 
число перестановок чрезвычайно быстро возрастает; так, при л = 5 
оно равно 51 = 120, а при л=10 — уже 3 628 800. 

Если в некоторой перестановке мы поменяем местами какие-либо 
два символа (не обязательно стоящие рядом), а все остальные сим- 
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волы оставим на месте, то получим, очевидно, новую перестановку. 
Это преобразование перестановки называется транспозицией. 

Все п\ перестановок из п символов можно расположить 
в таком порядке, что каждая следующая будет получаться из 
предыдущей одной транспозицией, причем начинать можно 
с любой перестановки. 

Это утверждение справедливо при п = 2: если требуется начи- 
нать с перестановки 12, то искомое расположение будет 12, 21; 
если же мы должны начать с перестановки 21, то это будет рас- 
положение 21, 12. Предположим, что наше утверждение уже дока- 
зано для п — 1, и докажем его для п. Пусть мы должны начать 
с перестановки 

• • •> *Ѵ 0) 

Рассмотрим все перестановки из п символов, у которых на первом 
месте стоит і г . Таких перестановок (п — 1)! и их можно упорядо- 
чить в согласии с требованиями теоремы, притом начиная с пере- 
становки (1), так как это сводится на самом деле к упорядочению 
всех перестановок из п — 1 символов, которое, по индуктивному 
предположению, можно начать с любой перестановки, в частности 
с перестановки і г , .... /„.В последней из полученных таким путем 
перестановок из п символов совершаем транспозицию символа і г 
с любым другим символом, например с і 2 , и, начиная с вновь по- 
лученной перестановки, упорядочиваем нужным образом все те пере- 
становки, у которых на первом месте стоит і г , и т. д. Этим путем 
можно, очевидно, перебрать все перестановки из п символов. 

Из этой теоремы вытекает, что от любой перестановки из п 
символов можно перейти к любой другой перестановке из тех же 
символов при помощи нескольких транспозиций. 

Говорят, что в данной перестановке чцсла і и у составляют инвер- 
сию, если і > у, но і стоит в этой перестановке раньше у. Переста- 
новка называется четной, если ее символы составляют четное число 
инверсий, и нечетной — в противоположном случае. Так, перестановка 
1 , 2, ..., п будет четной при любом п, так как число инверсий 
в ней равно нулю. Перестановка 451362 (л=6) содержит 8 инвер- 
сий и поэтому четная. Перестановка 38524671 (п — 8) содержит 
15 инверсий и поэтому нечетная. 

Всякая транспозиция меняет четность перестановки. 

Для доказательства этой важной теоремы рассмотрим сначала 
случай, когда транспонируемые символы і и у стоят рядом, т. е. 
перестановка имеет вид . .., і, у, ..., где многоточия заменяют 
те символы, которые не затрагиваются транспозицией. Транспози- 
ция превращает нашу перестановку в перестановку ..., у, і, ..., 
причем, понятно, в обеих перестановках каждый из символов і, у 
составляет одни и те же инверсии с символами, остающимися на 
месте. Если символы і и у раньше не составляли инверсии, то 
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в новой перестановке появляется одна новая инверсия, т. е. число 
инверсий увеличивается на единицу; если же они раньше составляли 
инверсию, то теперь она пропадает, т. е. число инверсий на еди- 
ницу уменьшается. В обоих случаях четность перестановки меняется. 

Пусть теперь между транспонируемыми символами і и ] распо- 
ложены 5 символов, 5>0, т. е. перестановка имеет вид 

> • • • , /і • • • (2) 

Транспозицию символов і и у можно получить в результате последо- 
вательного выполнения 25+1 транспозиций соседних элементов. 
А именно, это будут транспозиции, переставляющие символы і и к ѵ 
затем I (уже стоящие на месте символа к г ) и к 2 и т. д., пока і 
не займет место символа к 3 . За этими 5 транспозициями следует 
транспозиция, перемещающая символы і и у, а затем 5 транспозиций 
символа у со всеми к , после чего у занимает место символа і, а сим- 
волы к возвращаются на свои старые места. Таким образом, мы 
нечетное число раз меняли четность перестановки, а поэтому пере- 
становки (2) и 

. . ., У, А х , к 2 , . . ., к 5 , і, ... (3) 


имеют противоположные четности. 

При п Зв 2 число четных перестановок из п символов равно 

числу нечетных, т. е. равно ~п\. 

В самом деле, упорядочим, на основании доказанного ранее, все 
перестановки из п символов так, что каждая получается из преды- 
дущей одной транспозицией. Соседние перестановки будут иметь 
противоположные четности, т. е. перестановки расположены так, 
что четные и нечетные чередуются. Наше утверждение вытекает 
теперь из очевидного замечания, что при 2 число п\ четно. 

Определим теперь одно новое понятие, а именно понятие под- 
становки п-й степени. Запишем одну под другой две перестановки 
из а символов, беря полученные две строки в скобки; например, 


при п = 5: 


3 5 1 4 2\ 
52341 / 


( 4 ) 


В этом примере 1 ) под числом 3 стоит число 5, под числом 5 — 
число 2 и т. д. Мы скажем, что число 3 переходит в 5, число 3 
переходит в 2, число 1 переходит в 3, число 4 переходит в 4 (или 
остается на месте) и, наконец, число 2 переходит в 1. Таким 
образом, две перестановки, записанные друг под другом в виде (4), 
определяют некоторое взаимно однозначное отображение мно* 
жества из первых пяти натуральных чисел на Себя, т. е. отображе- 


х ) Внешне он напоминает матрицу из двух строк и 5 столбцов, но имеет 
совсем иной смысл. 
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ние, которое каждому из натуральных чисел 1, 2, 3, 4, 5 ставит 
в соответствие одно из этих же натуральных чисел, причем разным 
числам ставятся в соответствие различные же числа. При этом, так 
как чисел всего пять, т. е. конечное множество, каждое из этих 
пяти чисел будет соответствовать одному из чисел 1, 2, 3, 4, 5, 
а именно числу, которое в него «переходит». 

Ясно, что то взаимно однозначное отображение множества из 
первых пяти натуральных чисел, которое мы получили при по- 
мощи (4), можно было бы получить, записывая одну под другой и 
некоторые другие пары перестановок из пяти символов. Эти записи 
получаются из (4) путем нескольких транспозиций столбиков; таковы, 
например, 

/2 1 5 3 41 /1 5 2 4 3\ /2 5 1 '4 31 ,,, 

V 1 3 2 5 4у ’ Ѵз 2 1457’ \ 1 2 3 4 5/* 


Во всех этих записях 3 переходит в 5, 5 в 2, и т. д. 

Аналогичным путем две перестановки из п символов, записанные 
одна под другой, определяют некоторое взаимно однозначное ото- 
бражение множества первых п натуральных чисел на себя. Всякое 
взаимно однозначное отображение А множества первых п натураль- 
ных чисел на себя называется подстановкой п-й степени, причем, 
очевидно, всякая подстановка А может быть записана при помощи 
двух перестановок, подписанных одна под другой 



через а { здесь обозначается то число, в которое при подстановке А 
переходит число і, і— 1 , 2, ..., п. 

Подстановка А обладает многими различными записями вида (6). 
Так, (4) и (5) являются различными записями одной и той же под- 
становки 5-й степени. 

От одной записи подстановки А к другой можно перейти при 
помощи нескольких транспозиций столбиков. При этом можно полу- 
чить такую запись вида (6), в верхней (или нижней) строке которой 
стоит любая наперед заданная перестановка из п символов. В част- 
ности, всякая подстановка п- й степени А может быть записана 
в виде 

. /1 2 ... п 

Ѵ а 1 а 2 ■ • • &П 

т. е. с натуральным расположением чисел в верхней строке. При 
такой записи различные подстановки отличаются друг от друга 
перестановками, стоящими в нижней строке, и поэтому число под- 
становок п - й степени равно числу перестановок из п символов, 
т. е. равно п\ 
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Примером подстановки п- й степени служит тождественная под- 
становка 


при которой на месте остаются все символы. 

Следует заметить, что верхняя и нижняя строки в записи (6) 
подстановки А играют разные роли и, переставив их, мы, вообще 
говоря, получаем другую подстановку. Так, подстановки 4-й сте- 
пени 


(2 1 4 ЗД /4 3 1 2\ 

Ѵ4 3 1 2] и \2 1 4 3 у 

различны: при первой число 2 переходит в 4, при второй — в 3. 

Возьмем произвольную запись (6) некоторой подстановки п- й сте- 
пени А. Перестановки, составляющие верхнюю и нижнюю строки 
этой записи, могут иметь или одинаковые, или противоположные 
четности. Переход к любой другой записи подстановки А можно 
осуществить, как мы знаем, путем ‘последовательного выполнения 
нескольких транспозиций в верхней строке и соответствующих им 
транспозиций в нижней строке. Однако, совершая одну транспози- 
цию в верхней строке записи (6) и одну транспозицию соответ- 
ствующих элементов в нижней строке, мы одновременно меняем 
четности обеих перестановок и поэтому сохраняем совпадение или 
противоположность этих четностей. Отсюда следует, что либо при 
всех записях подстановки А четности верхней и нижней строк 
совпадают , либо же при всех записях они противоположны. 
В первом случае подстановка А будет называться четной , во вто- 
ром — нечетной. В частности, тождественная подстановка будет 
четной. 

Если подстановка А записана в виде (7), т. е. в верхней строке 
стоит четная перестановка 1, 2, . .., п, то четность подстановки А 
будет определяться четностью перестановки а х , а 2 , . . ., а п , стоящей 
в нижней строке. Отсюда следует, что число четных подстановок 

п-й степени равно числу нечетных, т. е. равно п! . 

Определению четности подстановок можно дать следующую не- 
сколько измененную форму. Если в записи (6) четности обеих строк 
совпадают, то число инверсий или в обеих строках четное, или в обеих 
нечетное, т. е. общее число инверсий в двух строках записи (6) 
будет четным; если же четности строк записи (6) противоположны, 
то общее число инверсий в этих двух строках нечетно. Таким обра- 
зом, подстановка А будет четной, если общее число инверсий 
в двух строках любой ее записи четно, и нечетной — в противо- 
положном случае. 
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Пример. Пусть дана подстановка пятой, степени 

/3 1 4 5 2\ 

\2 5 4 3 1 / ‘ 

В ее верхней строке 4 инверсии, в нижней 7 инверсий. Общее число 
инверсий в двух строках есть 11, и поэтому подстановка нечетна. 

Перепишем эту подстановку в виде 

/1 2 3 4 5\ 

\5 1 2 4 Зу ' 

Число инверсий в верхней строке есть 0, в нижней 5, т. е. общее число 
снова нечетно. Мы видим, что при разных записях подстановки сохраняется 
четность общего числа инверсий, но не само это число. 

Мы хотим указать теперь другие формы определения четности 
подстановок, эквивалентные приведенным выше '). Для этой цели 
определим умножение подстановок , представляющее и само па 
себе очень большой интерес. Подстановка п- й степени есть, как мы 
знаем, взаимно однозначное отображение множества чисел 1,2, . . . , п 
на себя. Результат последовательного выполнения двух взаимно 
однозначных отображений множества 1, 2, п на себя снова 

будет, очевидно, некоторым взаимно однозначным отображением 
этого множества на себя, т. е. последовательное выполнение двух 
подстановок л-й степени приводит к некоторой вполне определенной 
третьей подстановке л-й степени, называемой произведением первой 
из заданных подстановок на вторую. Так, если даны подстановки 
четвертой степени 



Действительно, при подстановке А символ 1 переходит в 3, но 
при В символ 3 переходит в 4, поэтому при АВ символ 1 пере- 
ходит в 4, и т. д. 

Можно перемножить лишь подстановки одинаковой степени. 
Умножение подстановок л-й степени при л 2* 3 некоммутативно. 
Действительно, для рассмотренных выше подстановок А и В произ- 
ведение ВА имеет вид 



т. е. подстановка ВА отлична от подстановки АВ. Такие примеры 
можно подобрать для всех л при л 5*3, хотя для некоторых пар 
подстановок закон коммутативности случайно может выполняться. 

*) Они потребуются нам лишь в главе 14, и поэтому при первом чтении 
этот материал можно опустить. 
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Умножение подстановок ассоциативно , т. е. можно говорить 
о произведении любого конечного числа подстановок п - й степени, 
взятых (ввиду некоммутативности) в определенном порядке. В самом 
деле, пусть даны подстановки А, В и С и пусть символ І ѵ 1 ^ п, 

переходит при подстановке А в символ і 2 , і 2 при подстановке В 
переходит в символ і 3 , а последний при подстановке С — в сим- 
вол / 4 . Тогда при подстановке АВ символ і г переходит в / 8 , при 
подстановке ВС символ / 2 переходит в / 4 , а поэтому как при ( АВ)С , 
так. и при А (ВС) символ і 4 будет переходить в символ г 4 . 

Очевидно, что произведение любой подстановки А на то- 
ждественную подстановку Е, а также произведение Е на А, 
равно А: 

АЕ = ЕА = А. 

Назовем, наконец, обратной для подстановки А такую подста- 
новку Л -1 той же степени, что 

АА~ 1 = А~ 1 А=Е. 

Легко видеть, что обратной для подстановки 

Л== П 2 я \ 

Ѵаі а* ... а„/ 

служит подстановка 

«г ••• М 

получающаяся из А переменой мест верхней и нижней строк. 

Рассмотрим теперь подстановки специального вида, получаю- 
щиеся из тождественной подстановки Е при помощи одной транс- 
позиции, производимой в ее нижней строке. Такие подстановки, 
нечетны: они называются транспозициями и имеют вид 



где многоточиями заменены символы, остающиеся на месте. Усло- 
вимся обозначать эту транспозицию символом (і, /). Применение 
транспозиции символов /, у к нижней строке записи (7) произволь- 
ной подстановки А равносильно умножению подстановки А справа 
на подстановку (8), т. е. на (г, у). 'Мы зна.ем, что все перестановки 
из п символов можно получить из одной из них, например 
из 1, 2, . . п, последовательным выполнением транспозиций; поэтому 
всякая подстановка может быть получена из тождественной подста- 
новки путем последовательного выполнения нескольких транспозиций 
в нижней строке, „т. е. путем последовательного умножения на 
подстановки вида (8). Можно утверждать, следовательно (опуская 
множитель Е ), что всякая подстановка представима в виде про- 
изведения транспозиций , 
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Всякую подстановку можно многими разными способами разло- 
жить в произведение транспозиций. Всегда можно, например, доба- 
вить два одинаковых множителя вида (/, у) (/, у), которые дают 
в произведении подстановку Е, т. е. взаимно уничтожаются. Укажем 
менее тривиальный пример: 

(2 5 4 3 і) = ( 12 И15) (34) = (14) (24) (45) (34) (13). 

Новый способ определения четности подстановки основан на сле- 
дующей теореме: 

При всех разложениях подстановки в произведение транспо- 
зиций четность числа этих транспозиций будет одна и та же, 
причем она совпадает с четностью самой подстановки. 

Так, подстановка в рассмотренном выше примере будет нечет- 
ной, как можно проверить и подсчетом числа инверсий. 

Эта теорема будет доказана, если мы покажем, что произведение 
любых к транспозиций есть подстановка, четность которой 
совпадает с четностью числа к. При к=\ это верно, так как 
транспозиция есть нечетная подстановка. Пусть наше утверждение 
уже доказано для случая к — 1 множителей. Тогда его справедли- 
вость для к множителей вытекает из того, что числа к — 1 и к 
имеют противоположные четности, а умножение подстановки (в дан- 
ном случае — произведения первых к — 1 множителей) на транспози- 
цию равносильно выполнению этой транспозиции в. нижней строке 
подстановки, т. е. меняет ее четность. 

.Удобным способом записи подстановок, позволяющим легко находить 
их четность, является разложение в циклы. Всякая подстановка п- й степени 
может некоторые из символов 1 , 2, . ... п оставлять на месте, другие же 
действительно перемещать. Циклической подстановкой или циклом назы- 
вается такая подстановка, что при повторении ее достаточное число раз 
всякий из действительно перемещаемых ею символов может быть переведен 
в любой другой из этих- символов. Такова, например, подстановка восьмой 
степени 

П 2 3 4 5 6 7 8\ 

\1 8 6 4 5 2 7 3) ’ 

она действительно перемещает символы 2, 3, 6 и 8, причем переводит сим- 
вол' 2 в 8, символ 8 в 3, символ 3 в 6, а символ 6 снова в 2. 

К числу циклов принадлежат все транспозиции. По аналогии с употреблен- 
ной выше сокращенной записью транспозиций, для циклов употребляется 
следующая запись: действительно переставляемые символы записываются 
в круглых скобках друг за другом в том порядке, в каком они друг в друга 
переходят при повторении подстановки; начинается запись с любого из дей- 
ствительно перемещаемых символов, а последний символ считается перехо- 
дящим в первый. Так, для указанного выше примера эта запись имеет вид 

(2 8 3 6). 

Число символов, действительно перемещаемых циклом, называется длиной 
цикла. 
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Два цикла п-й степени называются независимыми, если они ие имеют 
общих действительно переставляемых' символов. Понятно, что при пере- 
множении независимых циклов порядок множителей не влияет на результат. 

Всякая подстановка может быть единственным способом разложена 
в произведение попарно независимых циклов. Доказательство этого утвер- 
ждения не представляет затруднений, и мы его опускаем. Практически раз- 
ложение осуществляется следующим образом: начинаем с любого из действи- 
тельно перемещаемых символов и выписываем за ним те символы, в которые 
он переходит при повторении подстановки, пока не вернемся к исходному 
символу. После этого «закрытия» цикла начинаем с одного из оставшихся 
действительно перемещаемых символов, получаем второй цикл и т. д. 

Прим е р ы. 

'> (з 5 

2) (І 2 8 7 6 "з)-(1Я)<Э8>Щ>. 

Обратно, для всякой подстановки, заданной разложением в независимые 
циклы, можно найти запись в обычной форме (при условии, что степень 
этой подстановки известна). Например, 

3) 

если известно, что степень этой подстановки есть 7. 

Пусть дана подстановка п-й степени и пусть х есть число независимых 
циклов в ее разложении плюс число символов, оставляемых ею иа месте 1 ). 
Разность п — 5 называется декрементом этой подстановки. Декремент равен, 
очевидно, числу действительно перемещаемых символов, уменьшенному на 
число независимых циклов, входящих в разложение подстановки. Для рас- 
смотренных выше примеров 1), 2) и 3) декремент будет равен соответ- 
ственно 3, 4 н 4. 

Четность подстановки совпадает с четностью декремента этой 
подстановки. 

Действительно, всякий цикл длины к можно следующим образом пред- 
ставить в виде произведения к — 1 транспозиций: 

(й* й* , й) (й * й) (й* й) (й* Й) ■ 

Предположим теперь, что дано разложение подстановки А в независимые 
циклы. Если каждый из циклов будет разложен указанным сейчас способом 
в произведение транспозиций, то мы получим представление подстановки А 
в виде произведения транспозиций. Число этих транспозиций будет, очевидно, 
меньше числа символов, действительно перемещаемых подстановкой А, на 
число, равное числу независимых циклов в разложении этой подстановки. 
Отсюда следует, что подстановку А можно разложить в произведение транс- 
позиций, число которых равно декременту, а поэтому четность подстановки 
определяется четностью декремента. 


1 ) Всякому символу, оставляемому подстановкой на месте, можно было бы 
поставить в соответствие «цикл» длины 1, т. е., например, в указанном выше 
примере 2) писать: (156) (38) (47) (2). Мы не будем, однако, этого делагь. 
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§ 4. Определители и-го порядка 

Мы хотим теперь обобщить результаты, полученные в § 2 для 
п — 2 и 3, на случай произвольного л. Для этой цели необходимо 
ввести определители л-го порядка. Невозможно, однако, сделать это 
тем путем, каким были введены определители второго и третьего 
порядков, т. е. решая в общем виде системы линейных уравнений: 
по мере возрастания л вычисления становились бы все более и более 
громоздкими, а при произвольном л практически неосуществимыми. 
Мы выбираем иной путь: рассматривая уже известные нам определи- 
тели второго и третьего порядков, мы постараемся установить общий 
закон, по которому эти определители выражаются через элементы 
соответствующих матриц, и применим этот закон в качестве опре- 
деления для определителя порядка л, а затем докажем, что при 
таком определении правило Крамера остается справедливым. 

Напомним выражения определителей второго и третьего порядков: 


а п а 12 
а 21 а 22 
а и а 12 а 13 

а ‘П °22 а 23 
а 31 а 32 а 33 


а 11 а 22 а 12 а 21> 

а 11 а 22 Д 33 "Ь а 1? а 23 а 31 °13 0 21°32 

а 13 а 22 й 31 0 Х2 а 21°33 а 11 а 23 а 32' 


Мы видим, что всякий член определителя второго порядка есть 
произведение двух элементов, стоящих как в разных строках, так 
и в разных столбцах, причем все произведения такого вида, какие 
только можно составить из элементов матрицы второго порядка (их 
всего два), использованы в качестве членов определителя. Подобным же 
образом всякий член определителя третьего порядка является про- 
изведением трех элементов, также взятых по одному в каждой строке 
и в каждом столбце, причем снова все такие произведения исполь- 
зуются в качестве членов определителя. 

Пусть теперь дана квадратная матрица порядка п 


! 11 

а 12 .. 

• °1 П \ 

1 21 

а 22 . , 

. . сі 2п | 

1 п\ 

а л2 ■ 

■ • 


( 1 ) 


Рассмотрим всевозможные произведения по л элементов этой мат- 
рицы, расположенных в разных строках и разных столбцах, т. е. 
произведения вида 

а 1 аі а га 2 • • • а па п у ( 2 ) 


где индексы о^.о^, составляют некоторую перестановку из 

чисел 1,2, . . ., л. Число таких произведений равно числу различных 



38 


СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. ОПРЕДЕЛИТЕЛИ 


[ГЛ. 1 


перестановок из л символов, т. е. равно л!. Будем считать все эти 
произведения членами будущего определителя л-го порядка, соответ- 
ствующего матрице (1). 

Для определения знака, с каким произведение (2) входит в состав 
определителя, заметим, что из индексов этого произведения можно 
составить подстановку 

( 1 2 •••"') , ( 3 ) 

где і переходит в а--, если в состав произведения (2) входит эле- 
мент, стоящий в і - й строке и а,-м столбце матрицы (1). Рассматри- 
вая выражения определителей второго и третьего порядков, мы заме- 
чаем, что в них со знаком плюс входят те члены, индексы которых 
составляют четную подстановку, а со знаком минус — члены с нечет- 
ной подстановкой индексов. Естественно сохранить эту закономер- 
ность и в определении определителя л-го порядка. 

Мы приходим, таким образом, к следующему определению: опре- 
делителем п-го порядка, соответствующим матрице (1), называется 
алгебраическая сумма лі членов, составленная следующим образом: 
членами служат всевозможные произведения л элементов матрицы, 
взятых по одному в каждой строке и в каждом столбце, причем 
член берется со знаком плюс, если его индексы составляют четную 
подстановку, и со знаком минус — в противоположном случае. 

Для записи определителя л-го порядка, соответствующего мат- 
рице (1), мы будем, как и в случае определителей второго и третьего 
порядков, употреблять символ 


а 1і 

а іг • ■ 

°іл 

а 21 

022 • • 

* а 2п 

а п1 

а т ■ • 

• а пп 


Определители л-го порядка превращаются при п — 2 и л = 3 
в рассмотренные ранее определители второго и третьего порядков, 
а при п — 1, т. е. для матриц, состоящих из одного элемента, опре- 
делитель равен самому этому элементу. Мы не знаем пока, однако, 
можно ли йри л> 3 использовать определитель л-го порядка для 
решения систем линейных уравнений. Это будет показано в § 7; 
предварительно необходимо подвергнуть определители л-го порядка 
детальному изучению и, в частности, найти методы для их вычисле- 
ния, так как вычислять определители, непосредственно применяя их 
определение, даже при не очень больших л было бы весьма затруд- 
нительным. 

Сейчас мы установим некоторые простейшие свойства определи- 
телей л-го порядка, относящиеся преимущественно к одному из сле- 
дующих двух вопросов: с одной стороны, нас будут интересовать 
условия, при которых определитель равен нулю; с другой стороны, 
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мы укажем некоторые преобразования матрицы, которые не меняют 
ее определителя или же подвергают его легко учитываемым изме- 
нениям. 

Назовем транспонированием матрицы (1) такое преобразование 
этой матрицы, при котором ее строки делаются столбцами с тем же 
самым номером, т. е. переход от матрицы (1) к матрице 


'и 

а 21 ■ 

■■ а пі\ 


Та 

Я 22 • 

■: а А 

(5) 

1 1п 

а 2 П • ■ 

• • О'ПП/ 



можно сказать, что транспонирование есть поворот матрицы (1) около 
главной диагонали. Соответственно говорят; что определитель 


Та 

а п ■ 

■ • а п1 

Та 

°22 1 

. . а п2 

Т п 

а 2п ■ 

■■■ а пп 


получен транспонированием определителя (4). 

Свойство 1. Определитель не меняется при транспониро- 
вании. 

В самом деле, всякий член определителя (4) имеет вид 


а іа, а 2 Яі • • • а ла )( > (7) 

где вторые индексы составляют некоторую перестановку из симво- 
лов 1,2, . . ., п. Однако все множители произведения (7) и в опре- 
делителе (6) остаются в разных строках и разных столбцах, т. е. (7) 
служит членом и для транспонированного определителя. Верно, оче- 
видно, и обратное, и поэтому определители (4) и (6) состоят из одни* 
и тех же членов. Знак члена (7) в определителе (4) определяется 
четностью подстановки 


1 2 ... л \ . 
«1 «2 <* П / ’ 


( 8 ) 


в определителе (6) первые индексы элементов указывают на номер 
столбца, вторые — на номер строки, поэтому члену (7) в определи- 
теле (6) соответствует подстановка 


(? 2 ■/.; “•) • о* 

Подстановки (8) и (9) — в общем случае различные, но имеют, оче- 
видно, одну и ту же четность, а поэтому член (7) имеет в обоих 
определителях один и тот же знак. Таким образом, определители 
(4) и (6) являются суммами одинаковых членов, взятых с одинако- 
выми знаками, т. е. равны друг другу. 
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Из свойства 1 вытекает, что всякое утверждение о строках опре- 
делителя справедливо и для его столбцов и обратно, т. е. что 
в определителе (в отличие от матрицы) строки и столбцы равно- 
правны. Исходя из этого, мы будем дальнейшие свойства 2 — 9 фор- 
мулировать и доказывать лишь для строк определителя; аналогичные 
свойства для столбцов не будут требовать особого доказательства. 

Свойство 2. Если одна из строк определителя состоит из 
нулей, то определитель равен нулю. 

Действительно, пусть все элементы і - й строки определителя 
являются нулями. В каждый член определителя должен войти мно- 
жителем один элемент из і - й строки, поэтому в нашем случае все 
члены определителя равны нулю. 

Свойство 3. Если один определитель получен из другого 
перестановкой двух строк, то все члены первого определителя 
будут членами и во втором, но с обратными знаками, т. е. от 
перестановки двух строк определитель лишь меняет знак. 

В самом деле, пусть в определителе (4) переставляются і - я и /я 
строки, іф], а все остальные Строки остаются на месте. Мы полу- 
чаем определитель 

| а й а 1г ... а 1п I 


а ,1 а /і ■■■ а /п 

ац а, а ... а,„ 

°ПІ а пі а пп 

(сбоку указаны номера строк). Если 

а іа , а гОз ••• а па п ( 11 ) 

есть член определителя (4), то все его множители и в определителе 
(10) остаются, очевидно, в разных строках и разных столбцах. 
Таким образом, определители (4) и (10) состоят из одних и тех же 
членов. Члену (11) в определителе (4) соответствует подстановка 

/1 2 ... і ... і ... п 

\«і а*... а,- ... я/... « „ 

а в определителе (10) — подстановка 

/\ 2 ... і ... і ... п 

Ѵоса а, . . . а,- . . . а, . . . а я 
так как, например, элемент а, стоит теперь в /-й строке, но остается 
в старом а,-м столбце. Подстановка (13) получается, однако, из под- 
становки (12) путем одной транспозиции в верхней строке, т. е. имеет 
противоположную четность. Отсюда следует, что все члены опреде- 
лителя (4) входят в определитель- (10) с обратными знаками, т. е. 
определители (4) и (10) отличаются друг от друга лишь знаком. 




(0 

(/) 


( 10 ) 
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Свойство 4. Определитель, содержащий две одинаковые 
строка, равен нулю. 

В самом деле, пусть определитель равен числу сі и пусть соот- 
ветственные элементы его і- й и у-й строк (і ф у) равны между собой. 
После перестановки этих двух строк определитель станет равен, 
ввиду свойства 3, числу — й. Так как, однако, переставляются оди- 
наковые строки, то определитель на самом деле не меняется, т. е. 
й — — й, откуда д—0. 

Свойство 5. Если все элементы некоторой строки опре- 
делителя умножить на некоторое число к , то сам определитель 
умножится на к. 

Пусть на к умножены все элементы /- й строки. Каждый член опре- 
делителя содержит ровно один элемент из і-й строки, поэтому всякий 
член приобретает множитель к, т. е. сам определитель умножается на к. 

Это свойство допускает и такую формулировку: общий множи- 
тель всех элементов некоторой строки определителя можно 
вынести за знак определителя. 

Свойство 6. Определитель, содержащий две пропорциональ- 
ные строки, равен нулю. 

В самом деле, пусть элементы у-й строки определителя отли- 
чаются от соответствующих элементов і- й строки (іфі) одним и 
тем же множителем к. Вынося этот общий множитель к из у-й 
строки за знак определителя, мы получим определитель с двумя 
одинаковыми строками, равный нулю по свойству 4. 

Свойство 4 (а также свойство 2 при я> 1) является, очевидно, 
частными случаями свойства 6 (при к— 1 и к—0). 

Свойство 7. Если все элементы і-й строки определителя 
п-го порядка представлены в виде суммы двух слагаемых: 

а и — Ь / ф су, ]— 1 , . . ., п, 

то определитель равен сумме двух определителей, у которых все 
строки, кроме і-й, — такие же, как и в заданном определителе, 
а і-я строка в одном из слагаемых состоит из элементов б/, 
в другом — из элементов С/. 

Действительно, всякий член заданного определителя можно пред- 
ставить в виде 

а іоц а за 2 • ■ • а іаі • • • а па ѣ == а іа , а 2 а г • • • (баг с а;) • • • а па п ~ 

— а іа, а гщ • • • баі ■ ■ • а па п + а іа, а га 2 - • • с щ- • ■ а па п - 

Собирая вместе первые слагаемые этих сумм (с теми же знаками, какие 
имели соответствующие члены в заданном определителе), мы полу- 
чим, очевидно, определитель я-го порядка, отличающийся от задан- 
ного определителя лишь тем, что в і-й строке вместо элементов а -у 
стоят элементы &у. Соответственно вторые слагаемые составляют 
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определитель, в і - й строке которого стоят элементы с ]. Таким 
образом, 


а и 

й 12 

■ • а 1п 


Й 11 

а 12 • ■ • 

а 1 п 


°іі 

а 12 ■ 

• а 1п 

^і + с і 

&2 + с 2 ■ 

• - Ь п+ С п 

— 

Ьі 

^2 

ь 

и п 

+ 

Сі 

с 2 . . 

■ ° п 

а п1 

а п2 . 

■■ а пп 


а пІ 

а пі ... 

а пп 


а п1 

а „2 ■ • 

• а пп 


Свойство 7 без труда распространяется на случай, когда всякий 
элемент і- й строки есть сумма не двух, а т слагаемых, т 5*2. 

Будем говорить, что 1-я строка определителя есть линейная ком- 
бинация его остальных строк, если для всякой строки с номером ], 

}— 1 , ..., і — 1, і + 1, , п, можно указать такое число &у, что, 

умножая у- ю строку на к.-, а затем складывая все строки, кроме і- й 
(причем сложение строк следует понимать так, что складываются 
элементы всех этих строк в каждом столбце отдельно), мы получим 
і- ю строку. Некоторые из коэффициентов кА могут быть равными 
нулю, т. е. і- я строка будет на самом деле линейной комбинацией 
не всех, а лишь некоторых из оставшихся строк. В частности, если 
лишь один из коэффициентов к у отличен от нуля, мы получаем 
случай пропорциональности двух строк. Наконец, если строка состоит 
целиком из нулей, то она всегда будет линейной комбинацией осталь- 
ных строк, — случай, когда все Ау равны нулю. 

Свойство 8. Если одна из строк определителя есть линей- 
ная комбинация его других строк, то определитель равен нулю. 

Пусть, например, і- я строка будет линейной комбинацией а дру- 
гих строк, 1^5^/г — 1. Всякий элемент і- й строки будет тогда 
суммой а слагаемых, а поэтому, применяя свойство 7, мы представим 
наш определитель в виде суммы определителей, в каждом из кото- 
рых І-я строка будет пропорциональна одной из других строк. 
По свойству 6 все эти определители равны нулю; равен нулю, сле- 
довательно, и заданный определитель. 

Это свойство является обобщением свойства 6, причем, как будет 
доказано в § 10, оно дает самый общий случай равенства опреде- 
лителя нулю. 

Свойство 9. Определитель не меняется, если к элементам 
одной из его строк прибавляются соответственные элементы 
другой строки, умноженные на одно и то же число. 

Пусть, в самом деле, к і - й строке определителя сі прибавляется 
у- я строка, ]Фі , умноженная на число к, т. е. в новом определи- 
теле всякий элемент г-й строки имеет вид а із -\~ка із , $= 1,2, . . ., п. 
Тогда, на основании свойства 7, этот определитель равен сумме 
двух определителей, из которых первый есть й, а второй содержит 
две пропорциональные строки и поэтому равен нулю. 

Так как число к может быть и отрицательным, то определитель 
не меняется и при вычитании из одной его строки другой строки, 
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умноженной на некоторое число. Вообще, определитель не ме- 
няется, если к одной из его строк прибавляется любая линейная 
комбинация других строк. 

Рассмотрим один пример. Определитель называется кососимметрическим , 
если его элементы, симметричные относительно главной диагонали, отли- 
чаются друг от друга лишь знаком, т. е. если при всех і и / будет а у/ = — а,- /, 
отсюда следует, что для всех і будет ац= — ац—0. Таким образом, опре- 
делитель имеет вид 


0 

а 12 

а 13 

. . а 1п 

— Я 12 

0 

а 23 

. . а іп 

— Я 13 

— Я 23 

0 . 

• • а 3п 

— а т 

°2п 

-°3п 

.. 0 


Умножая каждую строку этого определителя на число — 1, мы получим 
транспонированный определитель, т. е. снова равный й, откуда, ввиду свой- 
ства 5, следует: 

(— і) п а=а. 

При нечетном п отсюда вытекает: — б — й, т. е. б — О. Таким образом, вся- 
кий кососимметрический определитель нечетного порядка равен нулю. 

§ б. Миноры и их алгебраические дополнения 

Выше уже отмечалось, что было бы затруднительно вычислять 
определители л-го порядка, применяя непосредственно их определе- 
ние, т. е. каждый раз выписывая все л! членов, определяя их знаки 
и т. д. Существуют более простые методы вычисления определите- 
лей, основанные на том, что определитель порядка л может быть 
'выражен через определители более низких порядков. С этой целью 
введем следующее понятие. 

Пусть дан определитель й порядка - л. Берем целое число к, удов- 
летворяющее условию \^к^п — 1, и в определителе й выбираем 
произвольные к строк и к столбцов. Элементы, стоящие на пересе- 
чении этих строк и столбцов, т. е. принадлежащие к одной из вы- 
бранных строк и к одному из выбранных столбцов, составляют, оче- 
видно, матрицу порядка к. Определитель этой матрицы называется 
минором к-го порядка определителя й. Можно сказать также, что 
минор к- го порядка есть определитель, получающийся после вычер- 
кивания в определителе й п — к строк и п — к столбцов. В част- 
ности, после вычеркивания в определителе одной строки и одного 
столбца мы получаем минор (п — 1)-го порядка; с другой стороны, 
минорами первого порядка будуѴ отдельные элементы определителя сі. 

Пусть в определителе й п- го порядка взят минор М к- го порядка. 
Если мы вычеркнем те строки и столбцы, на пересечении которых 
стоит этот минор, то останется минор М' (п — &)-го порядка, кото- 
рый называется дополнительным минором для минора М. Если мы 
вычеркнем, наоборот, те строки и столбцы, в которых расположены 
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элементы минора М' , то останется, очевидно, минор М. Таким об- 
разом, можно говорить о паре взаимно дополнительных 
миноров определителя. В частности, элемент а {] - и минор (п — 1)-го 
порядка, получающийся вычеркиванием в определителе /- й строки и 
у'-го столбца, будут составлять пару взаимно дополнительных миноров. 

Если минор к-го порядка М расположен в строках с номерами 
і ѵ і 2 , і к и в столбцах с номерами у 1( / 2 , то назовем 

алгебраическим дополнением минора М его дополнительный ми- 
нор М' , взятый со знаком плюс или минус в зависимости от того, 
четна или нечетна сумма номеров всех строк и столбцов, в кото- 
рых расположен минор М, т. е. сумма 

8 м— *'і + і% + • • • + ** +Л +Уз + • • • +Л- (1) 

Иными словами, алгебраическим дополнением для минора М будет 
число (— \умМ'. 

Произведение любого минора М к-го порядка на его алгебра- 
ическое дополнение в определителе д является алгебраической 
суммой, слагаемые которой, получающиеся от умножения членов 
минора М на взятые со знаком ( — 1)*м члены дополнительного 
минора М', будут некоторыми членами определителя д, причем 
их знаки в этой сумме совпадают с теми знаками, с какими 
они входят в состав определителя. 

Доказательство этой теоремы мы начнём со случая, когда ми- 
нор М расположен в левом верхнем углу определителя: 


«и 

а лк 

М ... 

а 1> к-Ъ\ 

■ • • &1п 

а к1 

■ • • , а кк 

а к< к+ 1 

• • • а кп 

а к + 1, X 

■ ■ ■ а & + 1, к 

а к + 1, к + 1 

. . п 
М’ ... 

а пІ 

■■■ а пк 

* + 1 

• ■ ®пп 


т. е. в строках с номерами 1, 2, ..., к и в столбцах с такими же 
номерами. Тогда минор ДТ будет занимать правый нижний угол 
определителя. Число зм в этом случае будет четным: 

Зм— 1 ~ Н 2 — |— ... — /г — 1 — 2 — ... — А = 2(1 2 ... -|— А) , 


поэтому алгебраическим дополнением для Л1 служит сам минор М ' . 
Берем произвольный член 


й іа, а га 2 • • • а кщ | 


( 2 ) 


минора М; его знак в М будет 
в подстановке 

С 2 

Ѵ“і <*г 


(— 1) г , если / есть число инверсий 
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Произвольный член 

а к+\, Р» + 1 + Рк + 2 • • • а "Рл (^) 

минора М' имеет в этом миноре знак ( — 1) г , где Г есть число 
инверсий в подстановке 

(й + 1 8 + 2 "’в)- <5) 

\Р* + 1 Р *+2 • • • Р п/ 

Перемножая члены (2) и (4), мы получим произведение п элементов 

а іа, а іа, ■ • • а Ъа к а Ь + \, + 2 . Р/с+» • • • а лР № > (6) 

расположенных в разных строках и разных столбцах определителя; 
оно будет, следовательно, членом определителя й. Знак члена (6) 
в произведении ММ' будет произведением знаков членов (2) и (4), 
т. е. ( — 1)*-( — 1)*' =( — Такой же знак имеет, однако, член (6) 
и в определителе й. Действительно, нижняя строка подстановки 

/1 2 ... к к + 1 к + 2 ... п \ 

\®і а 2 . . . <х к Р й+1 р * +2 . . . Р„/ 

составленной из индексов этого члена, содержит лишь / + /' инвер- 
сий, так как никакое а ни с одним из ^ не может составить инвер- 
сию: все а не больше к, все (і не меньше к 4-1. 

Этим доказан рассматриваемый нами частный случай теоремы. 
Переходим к рассмотрению общего случая, т. е. предположим, что 
минор М расположен в строках с номерами і х , і г , . . ., і к и в столб- 
цах с номерами ] х , у 2 , причем 

< . . . < і к , }\ < Л < • • • < Л- 

Постараемся, переставляя строки и столбцы определителя, передви- 
нуть минор М в левый верхний угол, причем так, чтобы дополни- 
тельный минор не изменился. Дли этой цели переставим г^-ю строку 
с (і х — 1)-й, затем с (і х — 2)-й и т. д., пока і х - я строка не займет 
место первой строки; для этого мы должны будем переставить строки 
П — 1 раз. Будем затем последовательно переставлять / 2 -ю строку 
со строками, расположенными над нею, пока она не расположится 
непосредственно под і х - й строкой, т. е. на месте, которое до начала 
всех преобразований занимала вторая строка; для этого, как легко 
проверить, мы должны будем переставить строки, / 2 — 2 раза. Ана- 
логичным образом г 3 -ю строку мы передвинем на место третьей 
строки и т. д., пока і к - я строка не окажется на месте к - й строки. 
Всего мы должны будем совершить 

(1 1 -\) + (і г -2) +....+(/*-*) = 

== (*1 + *2 4 * • • • + І/г) — 0 + 2 +■ . . . + к) 


транспозиций строк. 
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Минор М расположен уже в первый к строках нового опреде- 
лителя. Будем теперь последовательно переставлять столбцы опреде- 
лителя: д-й со всеми ему предшествующими, пока он не займет 
первого места, затем у 2 -й, пока он не займет второго места, и т. д. 
Всего столбцы будут переставлены 


(Л +Л + ■ • • +Л) — (1 + 2 + . . . + к) 

раз. 

После всех этих преобразований мы приходим к новому опреде- 
лителю й' , в котором минор М занимает левый верхний угол. Так 
как мы переставляли каждый раз лишь соседние строки или столбцы, 
то взаимное расположение строк и столбцов, содержавших в опреде- 
лителе й минор М', остается без изменения, а поэтому дополнитель- 
ным к минору М в определителе <і' остается минор М ’ , занимающий, 
однако, уже правый нижний угол. Как доказано выше, произведе- 
ние ММ' является суммой некоторого количества членов определи- 
теля йГ , взятых с теми же знаками, с какими они входят в й' . 
Однако определитель й' получен из определителя й путем 

[( г і + г 'а + • • • + *'*) — (1 + 2 ... + й)) + 

+ [(Л +Л + - • • +Л) ~ (1 + 2 + • • • 4- к)] = 

~$м — 2(1-4-2-(-,.,-)-й) 

транспозиций строк и столбцов, поэтому, как мы знаем из предшест- 
вующего параграфа, члены определителя й' отличаются от соответ- 
ственных членов определителя А. лишь знаком ( — і)^ (четное 
число 2(1 +2+ . . . -\-к) не будет, понятно, влиять на знак). Отсюда 
следует, что произведение ( — \)* м ММ' состоит из некоторого ко- 
личества членов определителя А, взятых с такими же знаками, какие 
они имеют в этом определителе. Теорема доказана. 

Заметим, что если миноры М и М' взаимно дополнительны, то 
числа 5м и $м' имеют одинаковую четность. Действительно, номер 
всякой строки и всякого столбца входит слагаемым в одно и только 
одно из этих чисел, а поэтому сумма $л*4-хлр равна общей сумме 
номеров всех строк и столбцов определителя, т. е. равна четному 
числу 2(1 +2+ . . . 

§ 6. Вычисление определителей 

Результаты предшествующего параграфа позволяют свести вы- 
числение определителя я-го порядка на вычисление нескольких опре- 
делителей (я — 1 )-го порядка. Введем сначала следующие обозначения: 
если — элемент определителя А, то через М^ обозначим допол- 
нительный минор или, короче, минор этого элемента, т. е. минор 
(я — 1)-го порядка, получающийся после вычеркивания из определи- 
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теля і - й строки и у-го столбца. Далее, через Ац обозначим алгебраи- 
ческое дополнение элемента а ; у, т. е. 

А и ={-\Г'М и . 

Как доказано в предшествующем параграфе, произведение а { іА і} 
является суммой нескольких членов определителя й, входящих в эту 
сумму с теми же знаками, с какими они входят в состав определи- 
теля й. Легко подсчитать число этих членов: оно равно числу членов 
в миноре Мц, т. е. равно (я — 1)!. 

Выбираем теперь любую і-ю строку определителя й и берем 
произведение каждого элемента этой строки на его алгебраическое 
дополнение: 

а цАц< а &Ац} • 0 ) 

Никакой член определителя й не может войти в состав двух 
разных из числа произведений (1): все члены определителя, входя- 
щие в произведение а іх А іх , содержат из і-й строки элемент а ІХ и 
поэтому отличаются от членов, входящих в произведение а і2 А і2 , 
т. е. содержащих из і-й строки элемент а,- 2 , и т. д. 

С другой стороны, общее число членов определителя д, входя- 
щих во все произведения (1), равно 

(л — 1)! -л = л!, 

т. е. этим исчерпываются вообще все члены определителя й. 
доказали, таким образом, что имеет место следующее разложение 
определителя й по і-й строке : 

д— а п А п + а і2 А іг + . . . + а іп А іп , (2) 

т. е. определитель й равен сумме произведений всех элементов 
произвольной его строки на их алгебраические дополнения. Ана- 
логичное разложение определителя можно получить и по любому его 
столбцу. 

Заменяя в разложении (2) алгебраические дополнения соответ- 
ствующими минорами со знаками плюс или минус, мы сведем 
вычисление определителя л-г о порядка к вычисле- 
нию нескольких определителей (л — 1)-го порядка. 
Заметим, что если некоторые из элементов і-й строки равны нулю, 
то соответствующие им миноры не нужно будет, понятно, вычислять. 
Ввиду этого полезно предварительно так преобразовать определитель, 
используя свойство 9 (см. § 4), чтобы в одной из строк или в одном 
из столбцов достаточно много элементов оказалось замененными 
нулями. В действительности свойство 9 позволяет в любой строке 
или любом столбце заменить нулями все элементы, кроме одного. 
В самом деле, если а ік Ф 0, то любой элемент і-й строки а ( -у, іфк, 
будет заменен нулем после вычитания &-го столбца, умноженного 
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на <Г ' из /' г0 столбца. Таким образом, вычисление определителя 

л-го порядка можно свести к вычислению одного определителя 
(л— 1)-го порядка. 

Примеры. 

1. Вычислить определитель четвертого порядка 

3 1—12 

—5 1 3 -4 

й ~ 2 0 1 -1 * 

1 —5 3-3 

Разложим его по третьей строке, используя наличие в ней одного нуляі 
1—12 

4=( — 1)3+і. 2. 1 3 — 4 + 

—5 3 —3 


3 

1 

2 

3 1 

— 1 

+ (_ 1)3+3. 1. _5 

1 

— 4 +(-1)Э+4.(_1).- 

—5 1 

3 

1 

-5 

-3 

1 -5 

3 


Вычисляя полученные определители третьего порядка, получим: 

4 = 2.16— 40 + 48 = 40. 

2. Вычислить определитель пятого порядка 

— 250—1 3 

1 0 3 7 —2 

4= 3—1 0 5 -5 . 

26—41 2 

0-3-1 2 3 

Прибавляя ко второй строке утроенную пятую и вычитая из четвертой строки 
учетверенную пятую, получим: 

—250—1 3 

1 —9 0 13 7 

4= 3—1 0 5—5. 

2 18 0—7 —10 

0-3-12 3 


Разложив этот определитель по третьему столбцу, содержащему лишь один 
ие равный нулю элемент (с суммой индексов 5 + 3, т. е. четной), получим 
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Преобразуем вновь полученный определитель, прибавляя к первой строке 
удвоенную вторую и вычитая из третьей строки утроенную вторую, а из 
четвертой — удвоенную вторую: 


0 

— 13 

25 

17 

1 

— 9 

13 

7 

0 

26 

-34 

-26 

0 

36 

— 33 

—24 


а затем разложим его по первому столбцу, причем заметим, что единствен- 
ному не равному нулю элементу этого столбца соответствует нечетная сумма 
индексов, получим: 


13 

25 

17 

26 

-34 

-26 

36 

-33 

— 24 


Вычислим этот определитель третьего порядка, предварительно разложив 
его по третьей строке: 


4 = 36 - 


25 
— 34 


17 

-26 


-(- 33 ). 


— 13 17 

26 —26 


+ (- 24 ). 


— 13 

26 


25 

-34 


= 36 - ( — 72 ) — ( — 33 )- (— 104 ) + ( — 24 )- (— 208 ) = — 1032 . 


3. Если все элементы определителя, расположенные по одну сторону 
от главной диагонали, равны нулю, то этот определитель равен произведе- 
нию элементов, стоящих на главной диагонали. 

Для определителя второго порядка это утверждение очевидно. Мы будем 
поэтому доказывать его по индукции, т. е. предположим, что для определи- 
телей ( п . — 1)-го порядка оно уже доказано, и рассмотрим определитель 
п-го порядка 


йц 

а 12 

«13 ■ 

• «1л 

0 

а 22 

«23 • 

• «2л 

0 

0 

«33 • 

• «3 л 

0 

0 

0 . 

• а пп 


Разлагая его по первому столбцу, получим: 



«22 

«23 • • 

• «2 л 

д — йц- 

0 

«33 • • 

• «3 п 


0 

0 . . 

«лл 


Но к минору, стоящему в правой части, применимо предположение индук- 
ции, т. е. он равен произведению а 22 а т ... а пп , а поэтому 


гі = а и а 2 2 а 3 з . . . а пп . 
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4. Определителем Вандермонда называется определитель 



1 

1 

1 

. 1 


а х 

Й 2 

а 3 

• о» 

&= 

а і 

а \ 

а 1 ■ 

■ 


“Г*" 

<~ х 

«Г 1 - 

•• «Г 1 


Докажем, что при любом п определитель Вандермонда равен произведе- 
нию всевозможных разностей а,' — ву, где !</<«'<«. Действительно при 
п= 2 будет 

1 1 к. . 


Пусть наше утверждение уже доказано для определителей Вандермонда 
(л — 1)-го порядка. Преобразуем определитель й следующим образом: из 
л-й (последней) строки вычитаем ( п — 1)-ю, умноженную на а 1 , затем из 
(л — 1)-й вычитаем (л — 2)-ю, также умноженную на а ь и т. д., наконец, из 
второй строки вычитаем первую, умноженную на,*»!. Мы получим: 



1 

1 

1 

1 


0 

л 2 — 

а 3 — а х 

... а п — а і 

4 = 

0 

а 2 — а 1 а 2 

й з — а х а 3 

О*— 


0 

а%~ 1 — а 1 а”~ 2 

аГ 1 -«і°Г в 

... о” -1 °і а п _г 


Разлагая этот определитель по первому столбцу, мы придем к определителю 
(л — 1)-го порядка; после вынесения из всех столбцов общих множителей 
за знак определителя он примет вид 


Л = (а г — а х ) (а 3 — «і) • • • (« л — <Д) • 


1 

1 

1 

а 2 

а 3 » • 

а п 



а 2 

п 

«Г* 

«г*.. 

а п ~ 2 

п 


Последний множитель является определителем Вандермонда (л — 1)-го по- 
рядка, т. е., по предположению, равен произведению всех разностей а,- — ау 

для 2</<»<л. Можно написать, следовательно, употребляя символ Л 
для обозначения произведения, что 


«г = (а 2 — а х ) (а 3 — аЛ... (а„— а х )- Ц (а,— ву)= Д («і— «/)• 

г</<Кп 1 </< 1 <л 


Таким же методом может быть доказано, что определитель 


п-і 

1 

«Г 1 

а"" 1 .. 

3 

«Г 1 

2 

1 

р 

а 2 

3 

«и 

і 

0 2 

а 3 

о„ 


1 

1 

. 1 
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равен произведению всевозможных разностей а,- — а/, где 1 < ] <я, т. е. 

= П (°/— а л 

1 < і < і < п 

Обобщая полученные выше разложения определителя по строке 
или столбцу, докажем следующую теорему, говорящую о разложе- 
нии определителя по нескольким строкам или столбцам. 

Теорема Лапласа. П усть в определителе й порядка п 
произвольно выбраны 6 строк (или к столбцов), \ — 1. 

Тогда сумма произведений всех миноров к-го порядка, содержа- 
щихся в выбранных строках, на их алгебраические дополнения 
равна определителю й. 

Доказательство. Пусть в определителе й выбраны строки 
с номерами і ѵ і %) ..., і к . Мы знаем, что произведение любого 
минора 6-го порядка М, расположенного в этих строках, на его 
алгебраическое дополнение состоит из некоторого количества членов 
определителя й, взятых с теми же знаками, с какими они входят 
в состав определителя. Теорема будет, следовательно, доказана, 
если мы покажем, что, заставляя М пробегать все миноры 6-го 
порядка, расположенные в выбранных строках, мы получим все 
члены определителя, причем ни один из них не встретится дважды. 

Пусть 

а іа, # 2а, • • • а па п ( 3 ) 

— произвольный член определителя й. Возьмем отдельно произве- 
дение тех элементов из этого члена, которые принадлежат к вы- 
бранным нами строкам с номерами і ѵ / 2 , . . . , і к . Это будет произ- 
ведение 

а *і а і, а Ца іг • • ■ а чщ к > ( 4 ) 

6 множителей этого произведения стоят в 6 различных столбцах, 
а именно, в столбцах с номерами ос^, а*,,..., щ к . Эти номера 
столбцов вполне определяются, следовательно, заданием члена (3). 
Если мы обозначим через М минор 6-го порядка, стоящий на пере- 
сечении столбцов с этими номерами а,,, оц 2 , ..., и выбранных 
ранее строк с номерами і ѵ і 2 , ..., і к , то произведение (4) будет 
одним из членов минора М, а произведение всех элементов из чле- 
на (3), не вошедших в (4)рчленом его дополнительного минора. 
Таким образом, всякий член определителя входит в произведение 
некоторого, притом вполне определенного, минора 6-го порядка из 
выбранных строк на его дополнительный минор, причем является 
произведением вполне определенных членов этих двух миноров. 
Для того же, наконец, чтобы получить взятый нами член опреде- 
лителя с тем знаком, какой он имеет в определителе, остается, 
как мы знаем, заменить дополнительный минор алгебраическим 
дополнением. Этим заканчивается доказательство теоремы. 
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Доказательство теоремы можно было бы вести и несколько иным 
путем. Именно, произведение любого минора к - го порядка М , рас- 
положенного в выбранных строках, на его алгебраическое дополне- 
ние состоит из к\ (п — к)\ членов, так как минор к-то порядка М 
состоит из к\ членов, а его алгебраическое дополнение, отличаясь, 
возможно, лишь знаком от минора порядка п — к, содержит (п — к)\ 
членов. С другой стороны, число миноров к - го порядка, содержа- 
щихся в выбранных нами строках, равно числу сочетаний из п по к, 
т. е. равно числу 

л! 

к\ (п — к)[ 

Перемножая, мы получаем, что сумма произведений всех миноров 
к-то порядка из выбранных строк на их алгебраические дополнения 
состоит из л! слагаемых. Таково же, однако, и общее число членов 
определителя сі. Теорема будет, следовательно, доказана, если мы 
покажем, что всякий член определителя й входит хотя бы один раз 
(а тогда и точно один раз) в рассматриваемую сумму произведений 
миноров на их алгебраические дополнения. Для этого читателю 
остается повторить (с некоторыми упрощениями) рассуждения, про- 
веденные в предшествующем доказательстве. 

Теорема Лапласа позволяет сводить вычисление определителя п-то 
порядка к вычислению нескольких определителей порядков к и л — к. 
Этих новых определителей окажется, вообще говоря, весьма много, 
и поэтому применять теорему Лапласа целесообразно лишь в том 
случае, если в определителе можно так выбрать к строк (или столб- 
цов), что многие из миноров к-то порядка, расположенных в этих 
строках, будут равны нулю. 


Примеры. 

1. Пусть дан определитель, все элементы которого, стоящие в первых 
к строках и последних п — к столбцах, равны нулю: 


°11 

• 

0 


°и 

■ ■ а кк 



а к + 1, 1 ■ 

■ а к+ 1 , к 

а к + 1 , к + 1 • 

• а к + 1, п 

а п1 

■ • а пк 

к + 1 

• • а пп 


Тогда этот определитель равен произведению двух своих миноров: 


а = 


а и ■ ■ ■ а і к 
а кІ ■■ ■ а кк 


а к + 1 , Ь + 1 ■ ■ ■ а к + 1 , п 


Для доказательства достаточно разложить определитель по первым 
к строкам. 

2. Пусть дан определитель й порядка 2п, в левом верхнем углу кото- 
рого стоит минор п- го порядка, составленный целиком из нулей. Если миноры 
п-го порядка, стоящие в правом верхнем, левом нижнем и правом нижнем 
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углах определителя, будут обозначены соответственно через М, М' и М " , 

О М 

т. е. определитель можно символически записать в виде гі= , 

М М 

то й = (— 1) п ММ'. 

Для доказательства разложим определитель по первым л строкам и за- 
метим, что 

* л = (1+2 + ...+я)-И(п+1)-Ия + 2)...+2я1=я + 2п*, 

т. е. $ м и п имеют одинаковую четность. 

3. Вычислить определитель 

—4 12—2 1 

О 3 0 1—5 

<Х= 2—3 1—3 1 • 

-1 —13—1 О 
О 4 0 2 5 I 


Разлагая его по первому и третьему столбцам, содержащим удачно распо- 
ложенные нули, мы получим: 



3 

1 

—5 


—4 2 [ 



^ ] ) 1+3 + 1+3 

О 1 1 

— 1 

0 


- 1] 4 

2 

5 


+ (_ 1)1 + 4 + 1+3 


+ (— I ) 3 


-4 2 3 1-5 

. —3 -3 14- 

— 1 3 4 2 5 

21 1 ~ 2 ! 

.3 1 — 5 = 

3 4 2 5 

(— 8 ) • (— 20 ) — (— 1 0 ) • (— 62 ) — 7 • 87 = - 1069 , 


§ 7. Правило Крамера 

Изложенная выше теория определителей я-го порядка позволяет 
показать, что эти определители, введенные лишь по аналогии с 
определителями второго и третьего порядков, подобно последним 
могут быть использованы для решения систем линейных уравнений. 
Сначала сделаем, впрочем, одно дополнительное замечание, связан- 
ное с разложениями определителей по строке или столбцу; это 
замечание будет в дальнейшем неоднократно использоваться. 

Разложим определитель 

Йц ... «і/ ... 0] п 

а 2 і . . . а 2 у . . . а 2п 

а пі • • •' а п] • • - а пп 
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по его /-му столбцу: 

а = а 1; 'Л 1у 4- а 2/А 2/ -{- ... + а п] -А пІ , 

а затем заменим в этом разложении элементы /-го столбца систе- 
мой п произвольных чисел Ь х , Ь . 2 , ..., Ь п . Выражение 

+ ^ 2 ^ 2 /+ •••+ Ь п А п р 

которое мы получим, будет, очевидно, служить разложением по 
/-му столбцу для определителя 

а и ••• ... а 1п 

а 2 і ... Ь 2 ... а 2п 

а п\ Ь п а„„ 

получающегося из определителя й заменой его /-го столбца столб- 
цом из чисел Ь х , Ь 2 , ..., Ь п . В самом деле, замена /-го столбца 
определителя й не влияет на миноры элементов этого столбца, 
а поэтому и на их алгебраические дополнения. 

Применим это к случаю, когда в качестве чисел Ь х , Ь 2 , ..., Ь п 
берутся элементы &-го столбца определителя д при к Ф /. Опре- 
делитель, который мы получим после такой замены, будет содер- 
жать два одинаковых столбца (/-й и к-РІ) и поэтому будет равен 
нулю. Равно нулю, следовательно, и разложение этого определи- 
теля по его /-му столбцу, т. е. 

а іИіу+ а 2 И 2 /+- + о пА Л п/ =0 при / ф к. 

Таким образом, сумма произведений всех элементов некото- 
рого столбца определителя на алгебраические дополнения соот- 
ветственных элементов другого столбца равна нулю. Такой же 
результат справедлив, конечно, и для строк определителя. 

Переходим к рас:мотрению систем линейных уравнений, при- 
чем ограничимся пока случаем систем, в которых число урав- 
нений равно числу неизвестных, т. е. систем вида 

« 11*1 4 ~ а 12 Х 2 4 ~ ••• + а іп Х п~^1і 

« 21*1 + « 22*2 + ... + а 2 „ х п=Ь „ 


«« 1*1 4 " «« 2*2 4 " ••• 4 - а пп х п Ь п - 

Дополнительно предположим, что определитель й из коэффи- 
циентов при неизвестных в этой системе, называемый кратко 
определителем системы , отличен от нуля. При этих предположе- 
ниях мы докажем, что система (1) совместна и даже определенна. 

В § 2, решая систему трех уравнений с тремя неизвестными, 
мы умножали каждое из уравнений на некоторый множитель, а 
затем складывали эти уравнения, после чего коэффициенты при 
двух неизвестных из трех оказывались равными нулю. Сейчас мы 
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§ 7 ] 

легко обнаруживаем, что множители, которые нами употреблялись, 
были алгебраическими дополнениями в определителе системы 
к элементу, являющемуся коэффициентом при искомом неизвест- 
ном в данном уравнении. Этот же прием будет теперь использован 
для решения системы (1). 

Предположим сначала, что система (1) совместна и а 1 , а 2 , 
а п — одно из ее решений. Справедливы, следовательно, равенства 

а ц а 1 + й 12 а 2 + ••• + С 1и а п — ^1> 

®21®1 ®22®2 ~Ь ••• “Ь ®2п®« == ^2> 


а т а і + а пг а 1 + - + а пп а п =К 

Пусть у будет любым из чисел 1, 2, ..., п. Умножим обе части 
первого из равенств (2) на А х ,, т. е. на алгебраическое дополне- 
ние элемента н определителе системы й\ обе части второго 
равенства умножим на А 2] и т. д., наконец, обе части послед- 
него — на А п] . Складывая затем отдельно левые и отдельно пра- 
вые части всех равенств, мы придем к следующему равенству; 

( а іИіУ + а 21 А 2 у + ••• + а /іИпу) а 1 + 

+ («іИіу + а 22^2у + ... + Я П А/) «8 + 



+ ( а іА/+ а 2/^2у+ ••• + й П] А П]) а 1 + 


4 - ( <2 1и‘ 4 1у _ і -а 2п^2у+ + а яА/)“п 

— у+ ^2^2у + ••• + Ь п А п 


Коэффициентом при в этом равенстве служит й, коэффици- 
енты при всех остальных а будут, ввиду сделанного выше заме- 
чания, равны нулю, а свободный член будет определителем, полу- 
чающимся из определителя <і после замены в нем у-го столбца 
столбцом из свободных членов системы (!). Если этот последний 
определитель мы обозначим, как и в § 2, через й], то наше равен- 
ство примет вид 


откуда, ввиду й Ф О, 


(іа.= а р 



Этим доказано, что если система (1) совместна, то она обладает 
единственным решением 


Л 


= і 


а п 


а 


( 3 ) 
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Покажем теперь, что система чисел (3) на самом деле удовле- 
творяет системе уравнений (1), т. е. что система (1) совместна. 
При этом мы используем следующую общеупотребительную сим- 
волику. 

Всякая сумма вида а г а 2 + ... + а п будет сокращенно обозна- 

П 

чаться через 2 а і- Если же рассматривается сумма, слагаемые 

і=і 

которой а { , снабжены двумя индексами, причем 2=1, 2, ..., п, 
І~ 1 , 2, ..., т, то можно сначала взять суммы элементов с фикси- 

т 

рованным первым индексом, т. е. суммы 2 а // І где *== 1, 2, ...,«, 

/= і 

а затем сложить все эти суммы. Мы получим тогда для суммы 
всех элементов а,-, запись 

} пт 

2 2 а,/. 

2 = 1 1=1 


Можно было бы, однако, вначале складывать слагаемые 
с фиксированным вторым индексом, а затем уже складывать полу- 
ченные суммы. Поэтому 


пт т п 

2 2 а, 7= 2 2 а,/, 

2 = 1 / = 1 / = 1 2 = 1 

т. е. в двойной сумме можно менять порядок суммирований. 

Подставим теперь в г'-е уравнение системы (1) значения неиз- 
вестных (3). Так как левую часть 2'-го уравнения можно записать 

п п 

в виде 2а,/*/ и так как 2?у=2^И */ , то мы получим: 


П 



/= I 



М*/) = 72> 

/г= 1 




/ = 1 


Относительно этих преобразований заметим, что число у оказа 


лось общим множителем во всех слагаемых и поэтому мы его 
вынесли за знак суммы; кроме того, после перемены порядка сум- 
мирований множитель Ь к вынесен за знак внутренней суммы, так 
как от индекса внутреннего суммирования / он не зависит. 

П 

Мы знаем, что выражение 2 а і, А кі — в ,'И*і+ а іИм+ ••• + а т А кп 

2 = 1 

будет равно й при к—і и равно 0 при всех других к. Таким 
образом, в нашей внешней сумме по к останется лишь одно сла- 
гаемое, а именно т. е. 




2 = 1 
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§ 71 

Этим доказано, что система чисел (3) действительно служит реше- 
нием для системы уравнений (1). 

Мы получили следующий важный результат: 

Система п линейных уравнений с п неизвестными, определи- 
тель которой отличен от нуля, обладает решением, и притом 
только одним. Это решение получается по формулам (3), т. е. по 
правилу Крамера - , формулировка этого правила такова же, как и 
в случае системы двух уравнений (см. § 2). 

Пример Решить систему линейных уравнений 

Чх у + х 2 — 5х 3 + * 4 = 8, \ 

х г — Зх 2 — 6*,= 9, I 

Чх 3 ~— х 3 -^-2х^ = — 5, Г 
х 1 -\-4х 2 — 7*3 + 6дг 4 = 0./ 

Определитель этой системы отличен от нуля: 

2 1—51 

1-3 0-6 

й- о 2—1 2 ==27 ‘ 

1 4—7 6 

поэтому к системе применимо правило Крамера. Значения неизвестных бу- 
дут иметь числителями определители 



8 
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Таким образом, 

Хі = ; 3, х 2 =* — 4, х 3 ~ — 1 , Х 4 — 1 
будет решением нашей системы, притом единственным. 

Мы исключили из рассмотрения случай, когда определитель 
системы п линейных уравнений с п неизвестными (1) равен нулю. 
Мы отнесем этот случай к гл. 2, где он найдет себе место в общей 
теории систем с любым числом . уравнений и любым числом неиз- 
вестных. 
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Относительно систем п линейных уравнений с п неизвестными 
сделаем еще одно замечание. Пусть дана система п линейных од- 
нородных уравнений с п неизвестными (см. § 1): 

®цХі "Ь “Ь ... -}- п 2 п х п = О, 

~Ь ... “I" ®2пХп — 0> 

а п\Хі "Ь П п2 Х 2 &ппХ п = 0- ) 

Все определители йр }— 1, 2 ..., п, содержат в этом случае стол- 
бец, составленный из нулей, и поэтому равны нулю. Таким обра- 
зом, если определитель системы (4) отличен от нуля, т. е. если 
к этой системе применимо правило Крамера, то единственным реше- 
нием системы (4) будет нулевое решение 

Хі — 0, х 2 = 0, ..., х п = 0. (5) 

Отсюда вытекает такой результат: 

Если система п линейных однородных уравнений с п неиз- 
вестными обладает решениями, отличными от нулевого, то опреде- 
литель этой системы необходимо равен нулю. 

В § 12 будет показано, что и обратно, если определитель такой 
системы действительно равен нулю, то, помимо нулевого решения, 
существование которого для всякой системы однородных уравнений 
очевидно, у нее будут существовать и другие решения. 

Пример. При каких значениях к система уравнений 

кх х -\- х 2 = 0, 1 
-)- кх : г = 0 / 

может обладать ненулевыми решениями? 

Определитель этой системы 


будет равен нулю лишь при 1. Легко видеть, что при каждом из этих 

двух значений к заданная система действительно обладает решениями, от- 
личными от нулевого. 

Значение правила Крамера заключается главным образом в том, 
что в тех случаях, когда это правило применимо, оно дает явное 
выражение для решения системы через коэффициенты этой системы. 
Практическое использование правила Крамера связано, однако, 
с весьма громоздкими вычислениями: в случае системы п линейных 
уравнений с п неизвестными приходится вычислять опреде- 

литель л-го порядка. Метод последовательного исключения неиз- 
вестных, изложенный нами в § 1, является в этом отношении много 
более удобным, так как вычисления, которых этот метод требует, 
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по существу равносильны тем, которые приходится выполнять при 
вычислении одного определителя я-го порядка. 

В различных приложениях встречаются системы линейных урав- 
нений, коэффициенты и свободные члены которых являются дейст- 
вительными числами, полученными в результате измерения некото- 
рых физических величин, т. е. известными лишь приближенно, 
с некоторой точностью. Для решения таких систем изложенные 
выше методы оказываются иногда неудобными, так как они приво- 
дят к результату с плохой точностью, и вместо них разработаны 
различные итерационные методы, т. е. методы, позволяю- 
щие решать указанные системы уравнений при помощи последова- 
тельного приближения неизвестных. Изложение этих методов чита- 
тель найдет в книгах по теории приближенных вычислений. 



ГЛАВА ВТОРАЯ 

СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ (ОБЩАЯ ТЕОРИЯ) 

§ 8. я-мерное векторное пространство 

Для построения общей теории систем линейных уравнений недо- 
статочно того аппарата, который с таким успехом послужил нам 
при решении систем, допускающих применение правила Крамера. 
Помимо определителей и матриц, мы должны будем использовать 
одно новое понятие, представляющее, быть может, еще больший 
общематематический интерес, а именно понятие многомерного 
векторного пространства. 

Сначала несколько предварительных замечаний. Из курса ана- 
литической геометрии известно, что всякая точка плоскости опре- 
деляется (при заданных осях координат) своими двумя координа- 
тами, т. е. упорядоченной системой двух действительных чисел; 
всякий вектор на плоскости определяется своими двумя компонен- 
тами, т. е. снова упорядоченной системой двух действительных 
чисел. Аналогично всякая точка трехмерного пространства опреде- 
ляется своими тремя координатами, всякий вектор в пространстве — 
тремя компонентами. 

В геометрии, а также в механике и физике часто приходится, 
однако, изучать такие объекты, для задания которых недостаточно 
трех действительных чисел. Так, рассмотрим совокупность шаров 
в трехмерном пространстве. Для того чтобы шар был полностью 
определен, нужно задать координаты его центра и радиус, т. е. 
задать упорядоченную систему четырех действительных чисел, из 
которых, впрочем, последнее (радиус) может принимать лишь поло- 
жительные значения. Рассмотрим, с другой стороны, различные 
положения твердого тела в пространстве. Положение тела будет 
вполне определено, если будут указаны координаты его центра 
тяжести (т. е. три действительных числа), направление некоторой 
фиксированной оси, проходящей через центр тяжести (два числа — 
два из трех направляющих косинусов), и, наконец, угол поворота 
вокруг этой оси. Таким образом, положение твердого тела в про- 
странстве определяется упорядоченной системой из шести дейст- 
вительных чисел. 
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Эти примеры указывают на целесообразность рассмотрения сово- 
купности всевозможных упорядоченных систем из « действительных 
чисел. Эта совокупность после введения в нее операций сложения 
и умножения на число (что будет сделано ниже по аналогии 
с соответствующими операциями над векторами трехмерного про- 
странства, выраженными через компоненты) и носит название «-мер- 
ного векторного пространства. Таким образом, «-мерное простран- 
ство есть лишь алгебраическое образование, сохраняющее некоторые 
простейшие свойства совокупности векторов трехмерного прост- 
ранства, выходящих из начала координат. 

Упорядоченная система « чисел 

а = («і, а 2 , ..., а п ) (1) 

называется п-мерным вектором. Числа а ь і— 1, 2, ..., «, будут 
называться компонентами вектора а. Векторы а и 

р = 1*1. К .... *„) (2) 

будут считаться равными в том случае, если совпадают их ком- 
поненты, стоящие на одинаковых местах, т. е. если а,- = 6, при 
/ = 1 , 2, ..., я. Для обозначения векторов будут употребляться 
дальше малые греческие буквы, в то время как малые латинские 
буквы будут использованы для обозначения чисел. 

В качестве примеров векторов укажем следующие: 1) Векторы- 
отрезки, выходящие из начала координат на плоскости или в трех- 
мерном пространстве, будут при фиксированной системе коорди- 
нат соответственно двух- и трехмерными векторами в смысле дан- 
ного выше определения. 2) Коэффициенты всякого линейного 
уравнения с п неизвестными составляют «-мерный вектор. 3) Вся- 
кое решение любой системы линейных уравнений с л неизвестными 
будет «-мерным вектором. 4) Если дана матрица из $ строк и п 
столбцов, то ее строки будут «-мерными векторами, столбцы — - 
«-мерными векторами. 5) Сама матрица из 5 строк и л столбцов 
может рассматриваться как 5я-мерный вектор: достаточно прочесть 
элементы матрицы подряд, строчку за строчкой; в частности, всякая 
квадратная матрица порядка « может рассматриваться как «^мер- 
ный вектор, причем, очевидно, всякий « 2 -мерный вектор может 
быть получен этим путем из некоторой матрицы порядка «. 

Суммой векторов (1) и (2) называется вектор 

а ~Г Р = ( а 1 -Г а 2~Г^2і •••, а п~ І Г^п ) і ( 8 ) 

компоненты которого суть суммы соответствующих компонент сла- 
гаемых векторов. Сложение векторов коммутативно и ассоциативно 
ввиду коммутативности и ассоциативности сложения чисел. 

Роль нуля играет нулевой вектор 

О = (0, 0, .... 0). 


(4) 
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Действительно, 

а + 0 = (а 1 + 0, а г + 0, .... а п + 0) = (о 1 , а 2 , ..., а„) = а. 

Для записи нулевого вектора мы употребляем тот же символ О, 
как и для числа нуль; решение вопроса, говорится ли в данный 
момент о числе нуль или о нулевом векторе, никогда не предста- 
вит затруднений; читатель должен помнить, однако, при изучении 
ближайших параграфов о возможности различных толкований сим- 
вола 0. 

Назовем противоположным вектору (1) вектор 

а = ( а^, —а 2 , .... — а п ). (5) 

Очевидно, что а + ( — а) = 0. Теперь легко видеть, что для сложе- 
ния векторов существует обратная операция — вычитание: разностью 
векторов (1) и (2) будет вектор а — р = а + ( — (3), т. е. 

а — Р = К — Ь 1г а 2 — Ь г , ..., а п *—Ь п ). (6) 

Сложение л-мерных векторов, определяемое формулой (3), воз- 
никло из геометрического сложения векторов на плоскости или 
в трехмерном пространстве, производимого по правилу параллело- 
грамма. В геометрии используется также умножение вектора на дей- 
ствительное число (на «скаляр»): умножение вектора а на число к 
означает при к> 0 растяжение а в к раз (т. е. сжатие при &<1), а 
при к <0 растяжение в |Л| раз и изменение направления на противо- 
положное. Выражая это правило через компоненты вектора а и пере- 
ходя к рассматриваемому нами общему случаю, мы получаем такое 
определение: 

Произведением вектора (1) на число к называется вектор 

ка = ак = (ка 1 , ка г , ..., ка п ), (7) 

компоненты которого равны произведению на к соответственных 
компонент вектора а. 

Из этого определения вытекают следующие важные свойства, 
проверка которых предоставляется читателю: 


к (а ± (3) = ка ± й|3; 

(8) 

(. к ± 1 ) а — ка±: /а; 

(9) 

к (Іа) = (кі) а; 

(10) 

1 -а— а. 

(П) 

Столь же легко проверяются, но могут быть получены 
ствия из свойств (8) — (11), следующие свойства: 

и как след- 

0-а = 0; 

02) 

(— 1)-а = — а; 

(13) 

к - 0 = 0; 

(14) 

если ка = 0, то или к — 0, или а = 0. 

(15) 
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Совокупность всех я-мерных векторов с действительными компо- 
нентами, рассматриваемая с определенными в ней операциями 
сложения векторов и умножения вектора на число, называется 
п-мерным векторным пространством. 

Подчеркнем, что в определение я-мерного векторного прост- 
ранства не входит никакое умножение вектора на вектор. Опреде- 
лить умножение векторов было бы легко — положить, например, что 
компоненты произведения векторов равны произведениям соответст- 
венных компонент сомножителей. Такое умножение не нашло бы 
у нас, однако, никаких серьезных приложений. Так, векторы-отрезки, 
выходящие из начала координат на плоскости или в трехмерном 
пространстве, составляют при фиксированной системе координат 
двумерное и, соответственно, трехмерное векторные пространства. 
Сложение векторов и умножение вектора на число имеют в этом 
примере, как уже отмечено выше, важный геометрический смысл, 
в то время как покомпонентному умножению векторов нельзя дать 
никакого разумного геометрического истолкования. 

Рассмотрим еще один пример. Левая часть линейного уравнения 
от п неизвестных, т. е. выражение вида 

/= а 1 х 1 -\-а і х г + ... + а п х п , 

называется линейной формой от неизвестных х 1У х 2 , ..., х п . Линей- 
ная форма / вполне определяется, очевидно, вектором (а 1 , а 2 , ..., а п ) 
из своих коэффициентов; обратно, всякий л-мерный вектор одно- 
значно определяет некоторую линейную форму. Сложение векторов 
и умножение вектора на число превращаются в соответствующие 
операции над линейными формами; эти операции широко исполь- 
зовались нами в § 1. Покомпонентное умножение векторов и 
в этом примере не имеет никакого смысла. 

§ 9. Линейная зависимость векторов 

Вектор р из л-мерного векторного пространства называется 
пропорциональным вектору а, если существует такое число к, что 
$ — ка (см. формулу (7) предыдущего параграфа). В частности, нуле- 
вой вектор пропорционален любому вектору а ввиду равенства 
О = 0-а. Если же р = ка и Рэ^О, откуда кф 0, то а = й _1 р, т. е„ 
для ненулевых векторов пропорциональность обладает свойством 
симметричности. 

Обобщением понятия пропорциональности векторов служит сле- 
дующее понятие, с которым (для случая строк матрицы) мы уже 
встречались в § 4: вектор р называется линейной комбинацией век- 
торов с^, <х а , ..., о,, если существуют такие числа / 1 , / 2 , ..., 1 $ , что 

Р = / 1 а 1 + / 2 а 2 + ••• + /А- 

Таким образом, /-я компонента вектора р, _/=!, 2, п, равна, 
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ввиду определения суммы векторов и произведения вектора на 
число, сумме произведений у'-х компонент векторов а 1 , а 2 , 
соответственно на / х , І г , •••, / 4 . 

Система векторов 

а х , а 2 , а г _ х , а г (г >2) (1) 


называется линейно зависимой , если хотя бы один из этих 
векторов является линейной комбинацией остальных векторов 
системы (1), и линейно независимой — в противоположном случае. 

Укажем другую форму этого весьма важного определения: 
система векторов (1) линейно зависима, если существуют такие 
числа к л , к 2 , ..., к п хотя бы одно из которых отлично от нуля, 
что имеет место равенство 

^1 а 1 “Ь ^2 а 2 “Ь + к г а г — 0. (2) 


Доказательство эквивалентности этих двух определений не пред- 
ставляет затруднений. Пусть, например, вектор а г из системы (1) 
есть линейная комбинация остальных векторов: 

а г — / х ос х -[- / а а 2 4 ... + А— Л-'-і- 

Отсюда вытекает равенство 

/ х а х / 2 а 2 ... + / г _ х а г _ х — а г = 0 , 

т. е. равенство вида (2), где &, = /,• для /=1, 2, ..., г— 1 и 
к г = — 1, т. е. к г ф 0. Пусть, обратно, векторы (1) связаны соот- 
ношением (2), в котором, например, к г Ф 0. Тогда 


а. 


■|) аі + (~кУ 2 + - + ( 


т. е. вектор а г оказался линейной комбинацией векторов а 1 ,а 2 , ...,а г _ 1 


Пример. Система векторов 

а х = (5, 2 , 1), а 2 = ( — 1, 3, 3), а 3 = (9, 7, 5), а 4 =(3, 8, 7) 
линейно зависима, так как векторы связаны соотношением 

4а х — а 2 — За 3 у- 2а 4 — 0. 

В этом соотношении все коэффициенты отличны от нуля. Между нашими 
векторами существуют, однако, и другие линейные зависимости, в которых 
некоторые из коэффициентов равны нулю, например 

2а х 4«2 — а 3 =0, За 2 + а 3 — 2а 4 = 0. 

Второе из данных выше определений линейной зависимости 
применимо и к случаю г— 1, т. е. к случаю системы, состоящей 
из одного вектора а: эта система тогда и только тогда будет 
линейно зависимой, если а = 0. Действительно, если а = 0, то, 
например, при к— 1 будет ка=0. Обратно, если ка— 0 и к Ф 0, 
то а = 0. 
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Отметим следующее свойство понятия линейной зависимости. 
Если некоторая подсистема системы векторов (1) линейно 
зависима, то и вся система (1) линейно зависима. 

Действительно, пусть векторы а 1г к 2 , а 8 из системы (1), 
где 5 '<г, связаны соотношением 

Мі + Ь 2 а 2 + — + *А=°. 

в котором не все коэффициенты равны нулю. Отсюда следует 
соотношение 

/г 1 а 1 + А 2 а 2 + ... + *Л + 0- а я- 1 + - + 0-«/-=°. 

т. е. система (1) линейно зависима. 

Из этого свойства вытекает линейная зависимость вся- 
кой системы векторов, содержащей два равных 
или, вообще, два пропорциональных вектора, а так- 
же всякой системы, содержащей нулевой вектор. 
Заметим, что доказанному сейчас свойству можно дать такую 
формулировку: если система векторов (1) линейно независима, 
то и всякая ее подсистема также линейно независима. 

Возникает вопрос, как много векторов может содержать линейно 
независимая система л-мерных векторов и существуют ли, в част- 
ности, такие системы с произвольно большим числом векторов. 
Для ответа на этот вопрос рассмотрим в / 2 -мерном векторном про- 
странстве векторы 

бі = (1, 0, 0, ..., 0), 

е 2 =(0, 1, 0, ..., 0), 

е„=(0, 0, 0, ..., 1), 

называемые единичными векторами этого пространства. Система 
единичных векторов будет линейно независимой', пусть 

* 1 ві+ л « е 2 + - + *,в«=0; 

так как левая часть этого равенства равна вектору (А х , к 2 , ..., к ), 
то 

(^1> ^2і •••» 

т. е. к~ 0, 2 = 1, 2, ..., п, так как все компоненты нулевого 
вектора равны нулю, а равенство векторов равносильно равенству 
их соответственных компонент. 

Мы нашли, таким образом, в л-мерном векторном пространстве 
одну линейно независимую систему, состоящую из л векторов. 
Читатель увидит позже, что на самом деле в этом пространстве 
существует бесконечно много различных таких систем. 
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Докажем, с другой стороны, следующую теорему: 

Всякие з векторов п-мерного векторного пространства со- 
ставляют при у>я линейно зависимую систему. 

Пусть, в самом деле, нам даны векторы 


а 1 — (°11, 

а 12> • • 

•і а іп)і 

а 2 ~( а 21> 

Я 22> • • 

•> а гп), 

( а л. 

«,2. ••• 

- <*,„)• 


Нам нужно подобрать такие числа к г , к 2 , к 3 , не все равные 

нулю, что 

*і“і + + ...+*,<*,= 0. (4) 

Переходя от равенства (4) к соответствующим равенствам между 
компонентами, получаем 

а и^і + а гі*г + • • • + а іі^=0, ^ 

° 12^1 4 " ° 22^2 4 " • • • 4 ~ I 


а 1л й 1 + а 2я^2 + • • • + а т к ц— ) 

Равенства (5) составляют, однако, систему я линейных однородных 
уравнений относительно у неизвестных к 1} к 2 , . .., к 3 . Число урав- 
нений в этой системе меньше числа неизвестных, а поэтому, как 
доказано в конце § 1, эта система обладает ненулевыми решениями. 
Таким образом, можно подобрать числа к х , к 2 , . . ., к 3 , не все рав- 
ные нулю, которые удовлетворяют требованию (4). Теорема доказана. 

Назовем линейно независимую систему л-мерных векторов 

«і, •••»«/■ (6) 

максимальной линейно независимой системой, если добавление к этой 
системе любого я-мерного вектора (3 дает уже линейно зависимую 
систему. Так как во всякой линейной зависимости, связывающей 
векторы а ѵ а а , ..., а п р, коэффициент при § должен быть отлич- 
ным от нуля — иначе система (6) была бы линейно зависимой, — то 
вектор р линейно выражается через векторы (6). Поэтому система 
векторов (6) тогда и только тогда будет максимальной линейно не- 
зависимой системой, если векторы (6) линейно независимы, а любой 
я-мерный вектор (3 является их линейной комбинацией. 

Из результатов, полученных выше, вытекает, что в п-мерном про- 
странстве всякая линейно независимая система , состоящая из 
п векторов, будет максимальной, а также что любая максималь- 
ная линейно независимая система векторов этого пространства 
состоит не более чем из п векторов. 

Всякая линейно независимая система п-мерных векторов 
содержится хотя бы в одной максимальной линейно независи- 
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мой системе. В самом деле, если заданная система векторов не 
максимальна, то к ней можно добавить один вектор так, что по- 
лученная система останется линейно независимой. Если эта новая си- 
стема все еще не максимальна-, то к ней можно добавить еще 
один вектор, и т. д. Этот процесс не может, однако, продол- 
жаться бесконечно, так как уже любая система л-мерных векторов, 
состоящая из л-1-1 вектора, будет линейно зависимой. 

Так как всякая система, состоящая из одного ненулевого век- 
тора, линейно независима, то мы получаем, что всякий ненулевой 
вектор содержится в некоторой максимальной линейно неза- 
висимой системе, а поэтому в п-мерном векторном простран- 
стве существует бесконечно много различных максимальных 
линейно независимых систем векторов. 

Возникает вопрос, существуют ли в этом пространстве макси- 
мальные линейно независимые системы с меньшим, чем л, числом 
векторов или же число векторов в любой такой системе непре- 
менно равно л? Ответ на этот важный вопрос будет дан ниже, после 
некоторых предварительных рассмотрений. 

Если вектор р является линейной комбинацией векторов 

«1, К 2і • • • * а г> (7) 

то часто говорят, что р линейно выражается через систему (7). 
Понятно, что если вектор Р линейно выражается через некоторую 
подсистему этой системы, то он будет линейно выражаться и через 
систему (7) — достаточно остальные векторы системы взять с коэф- 
фициентами, равными нулю. Обобщая эту терминологию, говорят, 
что система векторов 

Рі. Ра.'---. Р, (8) 


линейно выражается через систему (7), если всякий вектор р,-, 
і— 1, 2, . . ., 5, является линейной комбинацией векторов системы (7). 

Докажем транзитивность этого понятия: если система (8) ли- 
нейно выражается через систему (7), а система векторов 


Ѵі> Ѵа. — . V* (9) 

линейно выражается через систему (8), то (9) будет линейно выра- 
жаться и через (7). 

В самом деле, 

5 

Ѵу-2/у/Р/, У=1. 2, .... і, (10) 

І — 1 

Г 

но Р,- = 2 к 1т о і т , /=1,2, . . Подставляя эти выражения в (10), 

т = і 


получаем: 


У^= 2 к ІЛ а т 


\т= і 


Г / 5 

2 ( 2 І п к і т ) <*„, 
т = і \ (» 1 / 
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т. е. всякий вектор у,-, /=1, 2, будет линейной комбина- 

цией векторов системы (7).. 

Две системы векторов называются эквивалентными, если каж- 
дая из них линейно выражается через другую. Из доказанной сейчас 
транзитивности свойства систем векторов линейно выражаться друг 
через друга вытекает транзитивность понятия эквивалентности систем 
векторов, а также следующее утверждение: если две системы век- 
торов эквивалентны и если некоторый вектор линейно выра- 
жается через одну из этих систем, то он будет линейно вы- 
ражаться и через другую. 

Нельзя утверждать, что если одна из двух эквивалентных между 
собой систем векторов линейно независима, то этим же свойством 
обладает и другая система. Если же обе эти системы линейно не- 
зависимы, то о числе векторов, входящих в них, можно сделать 
одно важное высказывание. Докажем сначала следующую теорему, 
которую ввиду ее роли в дальнейшем и для удобства ссылок на- 
зовем основной теоремой. 

Если в п-мерном векторном пространстве даны две системы 
векторов: 

(I) а ѵ а 2і . . . , а,, 

(Ч) Рі, 

из которых первая линейно независима и линейно выражается 
через вторую, то число векторов в первой системе не больше, 
чем во второй, т. е. г^з. 

Пусть, в самом деле, г > в. По условию, каждый вектор системы 
(1) линейно выражается через систему (И): 

аі==а п р і Д^р.5, 

= #2іРі а 22&2 ~Ь • • • “г а 


а г — а г іРі -г а г 2 Р 2 + . . . + 

Коэффициенты этих линейных выражений составляют систему из г 
^-мерных векторов: 

'Уі = (а и , а 12 , 

Ѵг = ( а и< а 22> • ■ • • а 2$)> 

Ѵг^^гі’ а г 2’ •••> а гД 

Так как г^>з, то эти векторы линейно зависимы, т. в. 

ЬіУі + А 2 Ѵг + • • • + А Р Ѵ Г * 0. 
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§ 9 ] 


где не все коэффициенты к ъ к 2 к г равны нулю. Отсюда мы 

приходим к следующим равенствам между компонентами: 


Х к і а іі= 0 - •/ ==1 - 




/ = 1 


( 12 ) 


Рассмотрим теперь следующую линейную комбинацию векторов 
системы (1): 

к 1 а 1 \ к 2 сс 2 -Ь к г <х г 

Г 

или, короче, 2 Используя (11) и (12), получаем: 

і = і 



это противоречит, однако, линейной независимости системы (1). 

Из доказанной сейчас основной теоремы вытекает следующий 
результат: 

Всякие две эквивалентные линейно независимые системы 
векторов содержат равное число векторов. 

Любые две максимальные линейно независимые системы л-мер- 
ных векторов будут, очевидно, эквивалентными. Они состоят, следо- 
вательно, из одного и того же числа векторов, а так как существуют, 
как нам известно, системы такого рода, состоящие из п векторов, 
то мы получаем, наконец, ответ на поставленный ранее вопрос: 
всякая максимальная линейно независимая система векторов 
п-мерного векторного пространства состоит из п векторов. 

Из полученных результатов можно вывести и другие следствия. 

Если в данной линейно зависимой системе векторов взяты 
две в ней максимальные линейно независимые подсистемы, т. е. 
такие подсистемы, к которым нельзя присоединить ни одного 
вектора нашей системы, не нарушая линейной независимости, 
то эти подсистемы содержат равное число векторов. 

В самом деле, если в системе векторов 


«і, а 2 , а г (13) 

подсистема 

а и ос 2 , . . а,, 5<г, (14) 

будет максимальной линейно независимой подсистемой, то всякий 
из векторов а і+1 , . . . , а, будет линейно выражаться через систему (14). 
С другой стороны, всякий вектор а { из системы (13) линейно вы- 
ражается через эту систему: достаточно взять при самом век- 
торе а,- коэффициент 1, а при всех остальных векторах системы 
коэффициент 0. Теперь легко видеть, что системы (13) и (14) экви- 
валентны. Отсюда следует, что система (13) эквивалентна всякой из 
своих максимальных шинейно независимых подсистем, а поэтому все 
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эти подсистемы эквивалентны между собой, т. е., будучи линейно 
независимыми, содержат по одному и тому же числу векторов. 

Число векторов, входящих в любую максимальную линейно не- 
зависимую подсистему данной системы векторов, называется рангом 
этой системы. Используя это понятие, выведем еще одно следствие 
из основной теоремы. 

Пусть даны две системы п-мерных векторов: 

« 1 , «2. •••■ “г О 5 ) 

Рі, К •... 06) 

не обязательно линейно независимые, причем ранг системы (15) 
равен числу к, ранг системы (16) — числу I. Если первая система 
линейно выражается через вторую, то к Если же эти си- 
стемы эквивалентны, то к=1. 

В самом деле, пусть 


<*/,, •••, «4 

(17) 

Р/,. • • •> Р/і 

(18) 


будут, соответственно, любые максимальные линейно независимые 
подсистемы систем (15) и (16). Тогда системы (15) и (17) эквива- 
лентны между собой, и это же верно для систем (16) и (18). Из 
того, что система (15) линейно выражается через систему (16), вы- 
текает теперь, что система (17) также линейно выражается через 
систему (16), а поэтому и через эквивалентную ей систему (18), 
после чего остается, используя линейную независимость системы (17), 
применить основную теорему. Второе утверждение доказываемого 
следствия непосредственно вытекает из первого. 

§ 10. Ранг матрицы 

Если дана некоторая система я-мерных векторов, то возникает 
естественный вопрос, является ли эта система векторов линейно 
зависимой или нет. Нельзя рассчитывать на то, что в каждом кон- 
кретном случае решение этого вопроса будет получено без затруд- 
нений: при поверхностном рассмотрении системы векторов 

а = (2,-5, 1, -1), Р = (1, 3, 6, 5), у = (-1, 4, 1, 2) 

трудно заметить в ней какие-либо линейные зависимости, хотя в дей- 
ствительности эти векторы связаны соотношением 

7а— Зр + 11у = 0 

Один метод для решения этого вопроса дает § I; так как ком- 
поненты заданных векторов нам известны, то, считая неизвестными 
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§ 101 


коэффициенты искомой линейной зависимости, мы получаем систему 
линейных однородных уравнений, которую и решаем методом Гаусса. 
В настоящем параграфе будет указан другой подход к рассматри- 
ваемому вопросу; одновременно мы значительно приблизимся к на- 
шей основной цели — решению произвольных систем линейных урав- 
нений. 

Пусть дана матрица 



содержащая $ строк и п столбцов, причем числа 5 и п никак не 
связаны между собой. Столбцы этой матрицы, рассматриваемые как 
5-мерные векторы, могут, вообще говоря, быть линейно зависимыми. 
Ранг системы столбцов, т. е. максимальное число линейно незави- 
симых столбцов матрицы А (точнее, число столбцов, входящих 
в любую максимальную линейно независимую подсистему системы 
столбцов), называется рангом этой матрицы. 

Понятно, что подобным же образом строки матрицы А можно 
рассматривать как /г-мерные векторы. Оказывается, что ранг системы 
строк матрицы равен рангу системы ее столбцов, т. е. равен рангу 
этой матрицы. Доказательство этого весьма неожиданного утвер- 
ждения будет получено после того, как мы укажем еще одну форму 
определения ранга матрицы, дающую заодно способ его практического 
вычисления. 

Обобщим сначала на случай прямоугольных матриц понятие ми- 
нора. Выбираем в матрице А произвольные А строк и к столбцов, 
А=^тіп(5, п ). Элементы, стоящие на пересечении этих строк и столб- 
цов, составляют квадратную матрицу А-го порядка, определитель 
которой называется минором к-го порядка матрицы А. Дальше 
нас будут интересовать порядки тех миноров матрицы А, которые 
отличны от нуля, а именно наивысший среди этих поряд- 
ков. При его разыскании полезно учитывать следующее замечание: 
если все миноры к-го порядка матрицы А равны нулю, то равны 
нулю и все миноры более высоких порядков. В самом деле, раз- 
лагая всякий минор порядка к + у, к < А+у^ тіп (5, п), на осно- 
вании теоремы Лапласа, по любым А строкам, мы представим этот 
минор в виде суммы миноров порядка А, умноженных на некоторые 
миноры порядка у, и этим докажем, что он равен нулю. 

Докажем теперь следующую теорему о ранге матрицы: 

Наивысший порядок отличных от нуля миноров матрицы А 
равен рангу этой матрицы. 

Доказательство. Пусть наивысший порядок отличных от 
нуля миноров матрицы А равен г. Предположим, — что не нарушает 
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общности доказательства, — что минор г-го порядка О, стоящий 
в левом верхнем углу матрицы 



отличен от нуля, й фО. Тогда первые г столбцов матрицы А будут 
между собой линейно независимыми: если бы между ними суще- 
ствовала линейная зависимость, то, так как при сложении векторов 
складываются соответствующие компоненты, между столбцами ми- 
нора О существовала бы эта же линейная зависимость и поэтому 
минор О был бы равен нулю. 

Докажем теперь, что всякий /- й столбец матрицы А, г<СІ^п, 
будет линейной комбинацией первых г столбцов. Берем любое і, 
1 < і ^ а, и строим вспомогательный определитель (г-|- 1)-го порядка 


II 

<г 

а 11 

. . 

•• а 1 г 

а и 

а г1 • 

•• а гг 

а п 


а н • 

■ <*іг 

а п 


получающийся «окаймлением» минора Л) соответствующими элемен- 
тами /-го столбца и /-й строки. При любом I определитель А,- равен 
нулю. Действительно, если />г, то А,- будет минором (г-(-І)-го 
порядка нашей матрицы А и поэтому равен нулю ввиду выбора 
числа г. Если же то А,- уже не будет минором матрицы А, 

так как не может быть получен вычеркиванием из этой матрицы 
некоторых ее строк и столбцов; однако определитель А,- будет содер- 
жать теперь две равные строки и, следовательно, снова равен нулю. 

Рассмотрим алгебраические дополнения элементов последней стро- 
ки определителя А,-. Алгебраическим дополнением для элемента а и 
служит, очевидно, минор Р. Если же то алгебраическим 

дополнением для элемента а-у в А,- будет число 

а и ••• а і, і- 1 а і, /Чі ••• а і г а и 

Лу = (— 1) (г+ » +/ ; 

а П ••• а г,/~1 а г, /+1 ••• а гг а Н 

оно не зависит от і и поэтому обозначено через А^ Таким образом, 
разлагая определитель А,- по его последней строке и приравнивая 
это разложение нулю, так как Д ; = 0, мы получим: 

°іі‘^т+ а і2^2 + ••• “Ь а іг^г ~Ь а и® ~ 
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откуда, ввиду Оф 0, 
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а и р> а п 


А г 

О «I г- 


Это равенство справедливо при всех /, /=1,2, ...,$, а так как 
его коэффициенты от і не зависят, то мы получаем, что весь /-й 
столбец матрицы А будет суммой ее первых г столбцов, взятых, 

А А А 

соответственно, с коэффициентами — — ~ , 

Таким образом, в системе столбцов матрицы А мы нашли мак- 
симальную линейно независимую подсистему, состоящую из г столб- 
цов. Этим доказано, что ранг матрицы А равен г, т. е. доказана 
теорема о ранге. 

Эта теорема дает метод для практического вычисления ранга 
матрицы, а поэтому и для решения вопроса о существовании линей- 
ной зависимости в данной системе векторов; составляя матрицу, 
для которой данные векторы служат столбцами, и вычисляя ранг 
этой матрицы, мы находим максимальное число линейно независи- 
мых векторов нашей системы. 

Метод нахождения ранга матрицы, основанный на теореме о ранге, 
требует вычисления хотя и конечного, но, быть может, очень боль- 
шого числа миноров этой матрицы. Следующее замечание позволяет, 
однако, внести в этот метод значительные упрощения. Если чита- 
тель просмотрит еще раз доказательство теоремы о ранге, то за- 
метит, что мы не использовали при его проведении равенства нулю 
всех миноров (г+1)-го порядка матрицы А — в действительности 
употреблялись лишь те миноры (г+1)-го порядка, которые окай- 
мляют данный не равный нулю минор г-го порядка И (т. е. содер- 
жат его целиком внутри себя), и поэтому из равенства нулю лишь 
этих миноров вытекает, что г есть максимальное число линейно не- 
зависимых столбцов матрицы Д; последнее же влечет за собой ра- 
венство нулю вообще всех миноров (г 1)-го порядка этой матрицы. 
Мы приходим к следующему правилу вычисления ранга 
матрицы: 

При вычислении ранга матрицы следует переходить от 
миноров меньших порядков к минорам больших порядков. Если 
уже найден минор к-го порядка О, отличный от нуля, то тре- 
буют вычисления лишь миноры (к-\-\)-го порядка, окаймляющие 
минор О: если все они равны нулю, то ранг матрицы равен к. 


Примеры. 

1. Найти ранг матрицы 

( 2—4 3 1 0\ 

1 —2 1 — 4 2 \ 

0 1—1 3 1 )• 

4 -7 4 -4 5 / 
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Минор второго порядка, стоящий в левом верхнем углу этой матрицы, 
равен нулю. Однако в матрице содержатся и отличныг от нуля миноры вто- 
рого порядка, например 


Минор третьего порядка 



3 

1 

— 1 


окаймляющий минор й, отличен от нуля, й' = \, однако оба минора четвер- 
того порядка, окаймляющие минор &' , равны нулю: 


2 

—4 

3 

1 


2 

—4 

3 

0 

1 

—2 

1 

—4 

==0, 

1 

—2 

1 

2 

0 

1 

—1 

3 


0 

1 

—1 

1 

4 

—7 

4 

—4 


4 

—7 

4 

5 


Таким образом, ранг матрицы А равен трем. 

2. Найти максимальную линейно независимую подсистему в системе 
векторов 

а 1 = (2, -2, — 4), а 2 — ( 1 , 9, 3), а 3 = (-2, -4, 1), « 4 =(3, 7, -1). 


Составляем матрицу 


2 1—2 
—2 9 —4 
•-4 3 1 



для которой данные векторы служат столбцами. Ранг этой матрицы равен 
двум: минор второго порядка, стоящий в левом верхнем углу, отличен от 
нуля, но оба минора третьего порядка, его окаймляющие, равны нулю. Отсюда 
следует, что векторы а 1г а 2 составляют в заданной системе одну из макси- 
мальных линейно независимых подсистем. 


В качестве следствия из теоремы о ранге матрицы докажем 
утверждение, уже высказанное ранее: 

Максимальное число линейно независимых строк всякой мат- 
рицы равно максимальному числу ее линейно независимых столб- 
цов, т. е. равно рангу этой матрицы. 

Для доказательства транспонируем матрицу, т. е. сделаем ее стро- 
ки столбцами, сохраняя их нумерацию. При транспонировании макси- 
мальный порядок отличных от нуля миноров матрицы не может 
измениться, так как транспонирование не меняет определителя, а 
для всякого минора исходной матрицы минор, полученный из него 
транспонированием, содержится в новой матрице, и обратно. Отсюда 
следует, что ранг новой матрицы равен рангу исходной матрицы; 
он равен, вместе с тем, максимальному числу линейно независимых 
столбцов новой матрицы, т. е. максимальному числу линейно неза- 
висимых строк исходной матрицы. 
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§ 101 


Пример. В§8 уже было введено понятие линейной формы от п не- 
известных и. определено сложение линейных форм и их умножение на число. 
Это определение позволяет перенести на линейные формы понятие линейной 
зависимости со всеми его свойствами. 

Пусть дана система линейных форм 

/і — *і"Ь2** + • >: з'Ь0х 1 , 

/ 2 = 4х 1 — х 2 — 5 х 3 — 6 х і , 

/ 3“ *1 — Зх 2 4х 3 7х 3 , 

/4 = 2x1+ * 2 — * 3 . 

Нужно выделить в ней максимальную линейно независимую подсистему. 
Составим матрицу из коэффициентов этих форм: 



и найдем ее ранг. Минор второго порядка, стоящий в левом верхнем углу, 
отличен от нуля, но, как легко проверить, все четыре минора третьего по- 
рядка, его окаймляющие, равны нулю. Отсюда следует, что первые две строки 
нашей матрицы линейно независимы, а третья и четвертая будут их линей- 
ными комбинациями. Система / ь / 2 будет, следовательно, искомой подсисте- 
мой заданной системы линейных форм. 

Укажем еще одно важное следствие из теоремы о ранге ма- 
трицы. 

Определитель п-го порядка тогда и только тогда равен 
нулю, если между его строками существует линейная зависи- 
мость. 

В одну сторону это утверждение уже доказано в § 4 (свой- 
ство 8). Пусть теперь нам дан определитель п-то порядка, равный 
нулю, т. е. дана, иными словами, квадратная матрица л-го порядка, 
единственный минор которой, имеющий максимальный порядок, равен 
нулю. Отсюда следует, что наивысший порядок отличных от нуля 
миноров этой матрицы меньше л, т. е. ранг меньше п, а поэтому, 
на основании доказанного выше, строки этой матрицы линейно за- 
висимы. 

Понятно, что в формулировке доказанного сейчас следствия 
можно вместо строк говорить о столбцах определителя. 

Для вычисления ранга матрицы существует еще один метод, не связан- 
ный с теоремой о ранге и не требующий вычисления определителей. Он при- 
меним, впрочем, только в том случае, если мы хотим знать лишь самый ранг 
и не интересуемся тем, какие именно столбцы (или строки) составляют ма- 
ксимальную линейно независимую систему. Изложим этот метод. 

Элементарными преобразованиями матрицы А называются следующие 
преобразования этой матрицы: 

(a) перемена мест (транспозиция) двух строк или двух столбцов; 

(b) умножение строки (или столбца) на произвольное отличное от нуля 
число; 
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(с) прибавление к одной строке (или столбцу) другой строки (столбца), 
умноженной на некоторое число. 

Легко видеть, что элементарные преобразования не меняют ранга мат- 
рицы. Действительно, если эти преобразования применяются, например, 
к столбцам матрицы, то система столбцов, рассматриваемых как векторы, 
заменяется эквивалентной системой. Докажем это лишь для преобразова- 
ния (с), так как для (а) и (Ь) это очевидно. Пусть к і-му столбцу приба- 
вляется /-Й столбец, умноженный на число к. Если столбцами матрицы до 
преобразования служили векторы 

<*і <*;. •••, «/ (1) 

то после преобразования столбцами матрицы будут векторы 

щ, . . ., а ( = а, + кар . . . , ар . . . , а„. (2) 

Система (2) линейно выражается через систему (1), а равенство 

а,- = а ; — ко./ 

показывает, что система (1), в свою очередь, линейно выражается через (2) 
Эти системы, следовательно, эквивалентны, и поэтому И? максимальные ли- 
нейно независимые подсистемы состоят из одинакового числа векторов. 

Таким образом, при вычислении ранга матрицы можно предварительно 
ее упростить при помощи некоторой комбинации элементарных преобразо- 
ваний. 

Говорят, что матрица, содержащая 5 строк и п столбцов, имеет диаго- 
нальную форму, если все ее элементы равны нулю, кроме элементов а,,. 
а 32 , ...,а ГГ (где 0< г < шіп («, п) ), равных единице. Ранг этой матрицы 
равен, очевидно, г. 

Всякую матрицу можно элементарными преобразованиями привести 
к диагональной форме. 

В самом деле, пусть дана матрица 



Если все ее элементы равны нулю, то она уже имеет диагональную форму. 
Если же в ней есть элементы, отличные от нуля, то транспозицией строк 
и столбцов можно добиться того, чтобы элемент й и был отличен от нуля. 
Умножая затем первую строку на а~* , мы превратим элемент а п в единицу. 
Если мы вычтем теперь из /-го столбца, /> 1, первый столбец, умноженный 
на о,у, то элемент а, 7 - будет заменен нулем. Делая это преобразование со 
всеми столбцами, начиная со второго, а также со всеми строками, мы при- 
дем к матрице вида 



Совершая такие же преобразования с матрицей, остающейся в правом ниж- 
нем углу, ит. д., мы после конечного числа шагов придем к диагональной 
матрице, имеющей тот же ранг, что и исходная матрица А. 

Таким образом, для нахождения ранга матрицы нужно элементарными 
преобразованиями привести эту матрицу к диагональной форме и подсчитать 
число единиц, стоящих в последней на главной диагоНалй. 
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Пример. Найти ранг матрицы 


А = 




Переставляя в этой матрице первый и второй столбец, а зачем умножая 
I 

первую строку на число , мы придем к матрице 

<1 0—2' 

-4 -1 5 

I 3 7 . 

5 0 —10 

3 2 0; 

Прибавляя к ее третьему столбцу удвоенный первый столбец, а затем при- 
бавляя некоторое кратное новой первой строки к каждой из остальных строк, 
мы получим матрицу 

1 0 0 

0 —1 —3 

0 3 9. 

0 0 0 

1 0 2 6 , 

Умножая, наконец, вторую строку на — 1, вычитая из третьего столбца 
утроенный второй столбец, а затем вычитая из третьей и пятой строк не- 
которые кратные новой второй строки, мы придем к искомой диагональной 
форме 

1 0 0 ) 

0 1 0 
0 0 0. 

0 0 0 

^ о о о; 

Таким образом, ранг матрицы А равен двум. 

В гл. 13 мы еще раз встретимся с элементарными преобразованиями и 
диагональной формой матриц; это будут, впрочем, матрицы, элементами 
которых являются не числа, а многочлены. 


§ 11. Системы линейных уравнений 

Ми переходим к изучению произвольных систем линейных урав- 
нений, причем уже не делаем предположения, что число уравнений 
системы равно числу неизвестных. Наши результаты будут, впрочем, 
применимы и к тому случаю (оставленному в § 7 без рассмотрения), 
когда число уравнений равно числу неизвестных, но определитель 
системы равен нулю. 
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Пусть дана система линейных уравнений 

а іі-* г і + а і2 л: 2+ • • • + а іЛ == ^і» ^ 

а 21 Х 1 + °22 Х 2 + • • • + а 2 п х п — &2> 


<*ЗІ Х 1 + а ,2 Х 2 + ■■■+ ^п Х п = Ь,. 

Как мы знаем из § 1, прежде всего следует решить вопрос о сов- 
местности этой системы. Для этой цели возьмем матрицу А из коэф- 
фициентов системы и «расширенную» матрицу А, полученную при- 
соединением к А столбца из свободных членов, 


н 

( а 1\ а 12 • • 
й 21 а 22 • • 

■ ■ а т\ 
• • «2» ' 

|, А = | 

/ а 11 й 12 • ■ 
Й 21 й 22 ■ ■ 

■ ■ а 1п V, 

■ • а 2п ^2 | 


Ѵ Д .5І а з2 ■ ■ 

• • а зп/ 


\ а л * Л ■■ 

• в» ъ,) 


и вычислим ранги этих матриц. Легко видеть, что ранг матрицы А 
либо равен рангу матрицы А, либо на единицу больше последнего. 
В самом деле, берем некоторую максимальную линейно независимую 
систему столбцов матрицы А. Она будет линейно независимой и в ма- 
трице А. Если она сохраняет и свойство максимальности, т. е. 
столбец из свободных членов через нее линейно выражается, то ранги 
матрицы А н А равны; в противоположном случае, присоединяя к этой 
системе столбец из свободных членов, мы получаем линейно неза- 
висимую систему столбцов матрицы А, которая будет в ней макси- 
мальной. 

Вопрос о совместности системы линейных уравнений полностью 
решается следующей теоремой. 

Теорема Кронекер а — К а п е л л и. Система линейных урав- 
нений (1) тогда и только тогда совместна, когда ранг расши- 
ренной матрицы А равен рангу матрицы А. 

Доказательство. 1. Пусть система (і) совместна и пусть 
к ъ к 2 , ...,к п будет одним из ее решений. Подставляя эти числа 
вместо неизвестных в систему (1), мы получим у тождеств, которые 
показывают, что последний столбец матрицы А является суммой 
всех остальных столбцов, взятых соответственно с коэффициентами 
к ѵ к 2 , ..., к п . Всякий другой столбец матрицы А входит и в 
матрицу А и поэтому линейно выражается через все столбцы этой 
матрицы. Обратно, всякий столбец матрицы А является столбцом и 
в А, т. е. линейно выражается через столбцы этой матрицы. Отсюда 
следует, что системы столбцов матриц А и А эквивалентны между 
собой, а поэтому, как доказано в конце § 9, обе эти системы ^-мер- 
ных векторов имеют один и тот же ранг; иными словами, ранги 
матриц А и А равны между собой. 
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2. Пусть теперь дано, что матрицы Ли А имеют равные ранги. 
Отсюда следует, что любая максимальная линейно независимая си- 
стема столбцов матрицы А остается максимальной линейно независи- 
мой системой и в матрице А. Таким образом, через эту систему, 
а поэтому и вообще через систему столбцов матрицы А, линейно 
выражается последний столбец матрицы А. Существует, следова- 
тельно, такая система коэффициентов к х , к 2 , ..., к п , что сумма 
столбцов матрицы А, взятых с этими коэффициентами, равна столбцу 
из свободных членов, а потому числа к ъ к 2 , . .., к п составляют 
решение системы (1). Таким образом, совпадение рангов матриц А 
и А влечет за собой совместность системы (1). 

Теорема полностью доказана. При ее применении к конкретным 
примерам необходимо вычислить сперва ранг матрицы А, для чего 
найти один из тех отличных от нуля миноров этой матрицы, что все 
миноры, его окаймляющие, равны нулю; пусть это будет минор М. 
После этого следует вычислить все миноры матрицы А, окаймляю- 
щие М, но в А не содержащиеся (так называемые характеристи- 
ческие определители системы (1)). Если они все равны нулю, то 
ранг матрицы А равен рангу матрицы А и потому система (1) сов- 
местна, в противоположном случае она несовместна. Таким образом, 
теореме Кронекера — Капелли можно дать такую формулировку: си- 
стема линейных уравнений ( 1 ) тогда и только тогда сов- 
местна, если все ее характеристические определители равны 
нулю. 

Предположим теперь, что система (1) совместна. Теорема 
Кронекера — Капелли, при помощи которой мы устанавливаем совме- 
стность этой системы, утверждает существование решения; она не 
дает, однако, никакого способа для практического разы- 
скания всех решений системы. К этой задаче мы сейчас 
переходим. 

Пусть матрица А имеет ранг г. Как доказано в предшествующем 
параграфе, г равно максимальному числу линейно независимых строк 
матрицы А. Пусть, для определенности, первые г строк матрицы А 
линейно независимы, а каждая из остальных будет их линейной 
комбинацией. Тогда первые г строк матрицы А также будут линейно 
независимыми: всякая линейная зависимость между ними была бы 
линейной зависимостью и между первыми г строками матрицы А 
(вспомнить определение сложения векторов!). Из совпадения рангов 
матриц А и А следует, далее, что первые г строк матрицы А составляют 
в ней максимальную линейно независимую систему строк, т. е. вся- 
кая другая строка этой матрицы будет их линейной комбинацией. 

Отсюда следует, что всякое уравнение системы (1) можно пред- 
ставить как сумму первых г уравнений, взятых с некоторыми коэф- 
фициентами, а поэтому любое общее решение первых г уравнений 
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будет удовлетворять всем уравнениям системы (1). Достаточно, сле- 
довательно, найти все решения системы 

й іА 4~ а і2 х 2 4~ • • • 4" «іА = б 1г 

а 21 х 1 4" а 22 Х 2 4" • • • 4" а 2п х п ~ ^2> 


а п х 1 4- а г2 х 2 + ...+ а гп х п = Ь г . 

Так как строки из коэффициентов при неизвестных в уравне- 
ниях (2) линейно независимы, т. е. матрица из коэффициентов имеет 
ранг г, то г<ли, кроме того, хотя бы один из миноров г-го по- 
рядка этой матрицы отличен от нуля. Если г = л, то (2) будет 
системой с равным числом уравнений и неизвестных и с отличным от 
нуля определителем, т. е. она, а потому и система (1), обладает един- 
ственным решением, а именно — вычисляемым по правилу Крамера. 

II у сть теперь /•<« и пусть, для определенности, отличен от 
нуля минор г-го порядка, составленный из коэффициентов при пер- 
вых г неизвестных. Перенесем в каждом из уравнений (2) в правую 
часть все члены с неизвестными х г + ъ ..., х п и выберем для этих 
неизвестных некоторые значения с г+1 , . . ., с п : Мы получим систему г 
уравнений 

а п х і 4" а і 2 х 2 + • • ■ 4- а и х г ~ а \< г+і с г+і • • • а іп с пі 

а 2\ х \ ~ > Г а 22 Х 2 + ■ ■ ■ 4 ~ а 2 г Х г~ ®2, г + 1 С Л + 1 • • • а 2 п С Ю 


а г1 Х 1 + а г2 х 2 4- • • • 4 ~ а гг Х г ' — а г< г+1 С г + 1 а гп с , 

относительно г неизвестных х ъ х 2 , ...,х г . К этой системе приме- 
нимо правило Крамера, и поэтому она обладает единственным реше- 
нием с 1 , с 2 , ..., с г ; очевидно, что система чисел с ъ с 2 , . .., с п 
с г+1 , . . ., с п будет служить решением системы (2). Так как значения 
с г+1 , ...,с п для неизвестных лг г+1 , ..., х„, называемых свободны- 
ми неизвестными , мы могли выбирать произвольным образом, то этим 
путем будет пол учено бесконечно много различных решений системы (2). 

С другой стороны, всякое решение системы (2) может быть по- 
лучено указанным путем: если дано некоторое решение с х , с 2 , . . ., с п 
системы (2), то в качестве значений для свободных неизвестных 
берем числа с л+1 , . . ., с п . Тогда числа с 1т с 2 , . . ., с г будут удовле- 
творять системе (3) и поэтому будут составлять то единственное 
решение этой системы, которое вычисляется по правилу Крамера. 

Все сказанное выше объединяется в виде следующего правила 
решения произвольной системы линейных урав- 
нений: 

Пусть дана совместная система линейных уравнений (1) и 
пусть матрица из коэффициентов А имеет ранг г. Выбираем 
в А г линейно независимых строк и оставляем в системе (1) 
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§ Щ 

лишь уравнения, коэффициенты которых вошли в выбранные 
строки. В этих уравнениях оставляем в левых частях такие г 
неизвестных, что определитель из коэффициентов при них от- 
личен от нуля, а остальные неизвестные объявляем свободными 
и переносим в правые части уравнений. Давая свободным неиз- 
вестным произвольные числовые значения и вычисляя значения 
остальных неизвестных по правилу Крамера, мы получим все 
решения системы (1). 

Дополнительно еще раз формулируем следующий полученный 
нами результат: 

Совместная система (1) тогда и только тогда обладает 
единственным решением, если ранг матрицы А равен числу не- 
известных. 

Примеры. 1. Решить систему 

5х х — х 2 -}-2х 3 А- *4 = 7, \ 

2*і + *2 4хз 2 хі — 1, > 

— 3^2 — 6*3 — 5 х 4 — 0. 1 

Ранг матрицы из коэффициентов равен двум: минор второго порядка, 
стоящий в левом верхнем углу этой матрицы, отличен от нуля, но оба минора 
третьего порядка, его окаймляющие, равны нулю. Ранг расширенной матрицы 
равен трем, так как 

5-17 

2 1 1 = — 35 ф 0. 

1 —3 0 

Отсюда следует, что система несовместна. 

2. Решить систему 

7*і + 3х 2 = 2, \ 

*і — 2*2 = — 3, > 

4*і -(-9*2= И- > 

Ранг матрицы из коэффициентов равен двум, т. е. равен числу неизвест- 
ных; ранг расширенной матрицы также равен двум. Таким образом, система 
совместна и обладает единственным решением. Левые части первых двух 
уравнений линейно независимы; решая систему этих двух уравнений, мы 
получим для неизвестных значения 

_ _23 

*і~ 17 - *2- 17 - 

Легко видеть, что это решение удовлетворяет и третьему уравнению. 

3. Решить систему 

*і+ * 2 — 2*з— * 4 + * 5 =1. 1 

3*1 *2 + *3 + 4 * 4 + 3 * 5 = 4 , > 

*1 + 5*2 9*3 8 * 4 + * 5 = 0 . I 

Система совместная, так как ранг расширенной матрицы, как и ранг 
матрицы из коэффициентов, равен двум. Левые части первого и третьего 
уравнений линейно независимы, так как коэффициенты при неизвестных х г 
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и * 8 составляют отличный от нуля минор второго порядка. Решаем систему 
из этих двух уравнений, причем неизвестные * 3 ,* 4 , * 5 считаем свободными, 
переносим в правые части уравнений и предполагаем, что им уже приданы 
некоторые числовые значения. Мы получим, применяя правило Крамера: 

5,1 3 

х і^ 4 + 4 х з 4 х і х ь> 


Х 2 — л "Ь л Х 3 "Ь л Х і 


Эти равенства определяют общее решение заданной системы: давая в них 
свободным неизвестным произвольные числовые значения, мы получим все 
решения нашей системы. Так, решениями нашей системы будут, например, 

векторы (2, 5, 3, 0, 0), (3, 5, 2, 1, —2), ^0, — ~ , —1, 1, и т. д. С другой 

стороны, подставляя выражения для х х и * 2 из общего решения в любое 
из уравнений системы, например во второе, ранее исключенное из рассмо- 
трения, мы получим тождество. 

4. Решить систему 


1 ^* 1 “ * 2 _ ~ Х і 3 , \ 

х г —2х г — * 3 4-2* 4 = 2, I 

2*і + 5х, — * 4 = — 1, Г 

3*24-3*2 х 3 3* 4 = 1. )• 


Хотя число уравнений равно числу неизвестных, но определитель системы 
равен нулю и поэтому правило Крамера неприменимо. Ранг матрицы из 
коэффициентов равен трем — в правом верхнем углу этой матрицы располо- 
жен отличный от нуля минор третьего порядка. Ранг расширенной матрицы 
также равен трем, т, е. система совместна. Рассматривая лишь первые три 
уравнения и считая неизвестное х х свободным, мы получим общее решение 
в виде 

12 8,9 

*2 — — ^ Хі, *з — ■ — 4 * 2 , 0. 


5. Пусть дана система, состоящая из гг 4* 1 уравнений относительно п 
неизвестных. Расширенная матрица Л этой системы будет квадратной порядка 
п4-1. Если наша система совместна, то, по теореме Кронекера — Капелли, 
определитель матрицы Л должен быть равный нулю. 

Так, пусть дана система 


Хі — 8* 2 = 3, -I 

2*2 4- *2= 1, / 
4*2 4- 7* 2 = — 4 . ) 


Определитель из коэффициентов и свободных членов этих уравнений отличен 
от нуля! 



поэтому система несовместна. 

Обратное утверждение не будет, вообще говоря, справедливым! из 
равенства нулю определителя матрицы А не следует совпадение рангов 
матриц Л и Л. 
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§ 12. Системы линейных однородных уравнений 

Применим результаты предшествующего параграфа к случаю 
системы линейных однородных уравнений: 

а 11 Х 1 + а 12*2 + • . • + «і А “ О, 

« 81*1 + й 22*2 + • • • + <*2 А =* О , 


а 8І Х 1 + 0,2*2 + • • • + А = О* 

Из теоремы Кронекера — Капелли вытекает, что эта система всегда 
совместна, так как добавление столбца из нулей не может повысить 
ранга матрицы. Это, впрочем, видно и непосредственно — система (1) 
заведомо обладает нулевым решением (О, О, 

Пусть матрица А из коэффициентов системы (1) имеет ранг г. 
Если г = п, то нулевое решение бу лет единственным решением 
системы {})•, при г <і п система обладает также решениями, от- 
личными от нулевого, и для разыскания всех этих решений примет 
няется тот же прием, как выше в случае произвольной системы 
уравнений. В частности, система п линейных однородных уравне- 
ний с п неизвестными тогда и только тогда обладает решениями, 
отличными от нулевого, если определитель этой системы 
равен нулю 1 ). В самом деле, равенство нулю этого определителя 
равносильно утверждению, что ранг матрицы А меньше п. С другой 
стороны, если в системе однородных уравнений число уравнений 
меньше числа неизвестных, то система непременно обладает 
решениями, отличными от нулевого, так как ранг в этом случае 
не может быть равным числу неизвестных; этот результат уже был 
получен в § 1 из других соображений. 



Рассмотрим, в частности, случай системы, состоящей из п — 1 однород- 
ных уравнений относительно п неизвестных, причем предположим, что ле- 
вые части этих уравнений между собой линейно незави- 
симы. Пусть 


А 


11 

°12 

■Ощ \ 

21 

а 2а .. 

* а 2п \ 

п-1, 

1 а п-1,і 

• — 1, п / 


— матрица из коэффициентов этой системы; через М( обозначим минор 
(п — 1)-го порядка, получающийся после вычеркивания из матрицы А ее 

г'-го столбца, (=1,2 п. Тогда одним из решений нашей системы 

будет система чисел 

м и —М ш , М 3 , — М 4 (2) 

а всякое другое решение ему пропорционально. 


*) Одна половина этого утверждения уже была доказана в § 7, 
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Доказательство. Так как, по условию, ранг матрицы А равен п — 1, 
то один из миноров М і должен быть отличен от нуля; пусть это будет М п . 
Полагаем в нашей системе неизвестное х п свободным и переносим его 
в правую часть каждого из уравнений, после чего получим 

а іЛ + а 1 а У 2 + ...+ Ді, п-і х п-і— — а іп х п> 
а 2А+ а 22*2 4"* • • * 4"* а 2, п— 1 Х п — 1 = а іп Х П > 


а п- 1, 1*І + й п-1, 2*2 + • ■ • + в П-1, Л-1*Л-1 — — а п-1, л*п- 

Применяя затем правило Крамера, мы получим общее решение заданной 
системы уравнений, которому после легких преобразований можно придать 
вид 

. М- 

*, = (- ') п -‘ж п х П ’ ‘ =І * 2 я.- 1 - (3) 

Положив х п — (—\) п ~ 1 М п , мы получим: *,• = (— (=1,2 л— I, 

или, так. как разность (2п— і — 1)— (і— 1) = 2п — 2 ( есть четное, число, 
*,• = ( — т. е. система чисел (2) действительно будет решением нашей 
системы уравнений. Любое другое решение этой «системы получается из 
формул (3) при другом числовом значении неизвестного х п , и поэтому оно 
пропорционально решению (2). Понятно, что рассматриваемое утверждение 
справедливо и в том случае, когда М„= 0, но один из миноров М/, К 
<;(<л — 1, отличен от нуля. 

Решения системы линейных однородных уравнений обладают сле- 
дующими свойствами. Если вектор р = (д 1 , Ь 2 , . . . , Ь п ) является реше- 
нием системы (1), то при любом числе к вектор Ар = (кЬ 1 , кЬ 2 , . . . , кЬ п ) 
также будет решением этой системы, что проверяется непосредствен- 
ной подстановкой в любое из уравнений (1). Если, далее, вектор 
*у = (с х , с 2 , ..., с п ) — еще одно решение системы (1), то для этой 
системы служит решением и вектор р-р у = (А 1 -|-с 1 , Ь 2 -\-с 2 , ... 

. . + с„): 

2 а и ( Ь і + с /) — 2 а И Ь і + 2 а ц с !~ °> 1 = 1 • 2 - • • • . *• 

/= і /= і / = і 

Поэтому вообще всякая линейная комбинация решений однород- 
ной системы (1) будет сама решением этой системы. Заметим, 
что в случае неоднородной системы, т. е. системы линейных урав- 
нений, свободные члены которых не все равны нулю, соответствую- 
щее утверждение не имеет места: ни сумма двух решений системы 
неоднородных уравнений, ни произведение решения этой системы на 
число не будут уже служить решениями для этой системы. 

Мы знаем из § 9, что всякая система л-мерных векторов, со- 
стоящая более чем из п векторов, будет линейно зависимой. Отсюда 
следует, что из числа решений однородной системы (1), являющихся, 
как мы знаем, л-мерными векторами, можно выбрать конечную 
максимальную линейно независимую систему, максимальную в том 
смысле, что всякое другое решение системы (1) будет линейной 
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комбинацией решений, входящих в эту выбранную систему. Всякая 
максимальная линейно независимая система решений однородной 
системы уравнений (1) называется ее фундаментальной системой 
решений. 

Еще раз подчеркнем, что п-мерный вектор тогда и только тогда 
будет решением системы (1), если он является линейной ком- 
бинацией векторов, составляющих данную фундаментальную 
систему. 

Понятно, что фундаментальная система будет существовать лишь 
в том случае, если система (1) обладает ненулевыми решениями, 
т. е. если ранг ее матрицы из коэффициентов меньше числа неиз- 
вестных. При этом система (1) может обладать многими различными 
фундаментальными системами решений. Все эти системы эквивалентны, 
однако, между собой, так как каждый вектор всякой из этих систем 
линейно выражается через любую другую систему, и поэтому 
системы состоят из одного и того же числа решений. 

Справедлива следующая теорема: 

Если ранг г матрицы из коэффициентов системы линейных 
однородных уравнений (1) меньше числа неизвестных п, то вся- 
кая фундаментальная система решений системы (1) состоит 
из п — г решений. 

Для доказательства заметим, что п — г является числом свобод- 
ных неизвестных в системе (1); пусть свободными будут неизвест- 
ные х г+ѵ х г+2 , ..., х п . Рассмотрим произвольный отличный от 
нуля определитель й порядка п—г, который запишем в следующем 
виде: 



С 1, Г+1’ 

С 1, Г+2’ • • • > 

С 1* 


С 2, Г + 1’ 

С 2> Г + 2’ * • •> 

С 2п 


С п-Г , Г + 1’ 

С п-Т . Г + 2’ • • • > 

^п—г> п 


Беря элементы і-й строки этого определителя, 1 — г, в ка- 

честве значений для свободных неизвестных, мы, как известно, 
получим однозначно определенные значения для неизвестных х и 
х 2 , ..., х г , т. е. придем к вполне определенному решению системы 
уравнений (1); запишем это решение в виде вектора 

а і 5=1 С І2’ • • •> с іг’ С І, Г + 1’ с і . г + 2> • • •> с іп)' 

Полученная нами система векторов а г , а 2 , . . ., а„_ г служит для 
системы уравнений (1) фундаментальной системой решений. В самом 
деле, эта система векторов линейно независима, так как матрица, 
составленная из этих векторов как из строк, содержит отличный от 
нуля минор й порядка п — г. С другой стороны, пусть 

Р — (\> ^2’ • • • > ^Г’ ^Г + 1> &Г + 2> • • •> К) 
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будет произвольное решение системы уравнений (1). Докажем, что 
вектор (3 линейно выражается через векторы а х , а 2 , а п _ т . 

Обозначим через а'., і = 1, 2, . л — г, і - ю строку определи- 
теля й, рассматриваемую как (л — г)-мерный вектор. Положим, 
далее, 

Р ~ Г + 1 > ^Г + 2 > • * • I Ь п ) • 

Векторы а', / = 1, 2, . ..,л — г, линейно независимы, так как (іфО. 
Однако система (л — г)-мерных векторов 

а і- а 2- •••> Р' 

линейно зависима, так как в ней число векторов больше их размер- 
ности. Существуют, следовательно, такие числа к х , к 2 , ...,к п _г, 
что 

Р = к 1 а і + к 2 а сі + . . . + к п _ г а' п _ г . (4) 

Рассмотрим теперь л-мерный вектор 

Ь = к 1 <х 1 + к 1 а 2 + ...+к п _ г а п _ г — $. 

Вектор б, являясь линейной комбинацией решений системы однород- 
ных уравнений (1), сам будет решением этой системы. Из (4) сле- 
дует, что в решении б значения для всех свободных неизвестных 
равны нулю. Однако то единственное решение системы уравнений (1), 
которое получается при равных нулю значениях для свободных не- 
известных, будет нулевым решением. Таким образом, 6 = 0, т. е. 

Р = + /г 2 а 2 + . . , +к п _ г а гі _ г . 

Теорема доказана. 

Заметим, что проведенное выше доказательство позволяет утвер- 
ждать, что мы получим все фундаментальные системы решений 
системы однородных уравнений (1), беря в качестве й всевозможные 
отличные от нуля определители порядка л — г. 

Пример. Дана система линейных однородных уравнений 

3*і + х 2 — 8* 3 + 2 х 4 + х 6 = 0, а 
2х г — 2х 2 — З* 3 — 7х 4 + 2дг 6 = 0, I 
*4 + і 1*2 — 12*3 + 34*4 — 5*5 = 0, 1 
*! — 5*і+ 2*3 — 16*4 + 3*5 = 0. ) 


Ранг матрицы из коэффициентов равен двум, число неизвестных равно 
пяти, поэтому всякая фундаментальная система решений этой системы урав- 
нений состоит из трех решений. Решим систему, ограничиваясь первыми 
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двумя линейно независимыми уравнениями и считая х 3 , х 4 , х 6 свободными 
неизвестными. Мы получим общее решение в виде 


8 Хз+ 8 2 


^2 = -й х з — а" х і + -о х ь- 


Берем, далее, следующие три линейно независимых трехмерных вектора 
(1, 0, 0), (0, 1, 0), (0, 0, 1). Подставляя компоненты каждого из них в общее 
решение в качестве значений для свободных неизвестных и вычисляя зна- 
чения для х 3 и х 2 , мы получим следующую фундаментальную систему ре- 
шений заданной системы уравнений: 


г --(!• 
і, о, о, і). 


■|, 0 . І.о), 


Мы закончим параграф рассмотрением связи, существующей ме- 
жду решениями неоднородных и однородных систем. Пусть дана 
система линейных неоднородных уравнений: 

«11*1 + «12*2 + • •• + «1п*/» = ^И 1 

а 21 х х + а 22 х 2 + ...+а 2п х п = Ь 2 , 


«Л*1 + «,2*2 + • • - + «,„*» = Ь г 

Система линейных однородных уравнений: 

« 11*1 + « 12*2 + • • - + «1 гі Х П = 0 , 
«21*1 + «22*2 + • • • + «2л*п = 


«, 1*1 + « 12*2 + • • - + «„*» - 0 , 


полученная из системы (5) заменой свободных членов нулями, назы- 
вается приведенной системой для системы (5). Между решениями 
систем- (о) и (6) существует тесная связь, как показывают следую- 
щие две теоремы. 

I. Сумма любого решения системы (5) с любым решением при- 
веденной системы (6) снова будет решением системы (5). 

В самом деле, пусть с х , с 2 , с п — решение системы (5), 

ё п — решение системы (6). Берем любое из уравнений 
системы (5), например к-е, и вставляем в него вместо неизвестных 
числа с 1 + «? 1 , с 2 + й 2 , .... с п -\-й п . Мы получим: 

2 а Ы ( С 1 + а і) ~ 2 а Ы с і + 2 «*А ~ ъ к + 0 == Ь к . 

I - і / = і /= і 
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II. Разность любых двух решений системы (5) служит реше- 
нием для приведенной системы (6). 

Действительно, пусть с 2 , с п и 'с', с', — решения 

системы (5). Берем любое из уравнений системы (6), например к-е, 
и подставляем в него вместо неизвестных числа 

с і с х> с 2 с 2 ’ с « с п- 

Мы получим: 

23 а А/ ( с / ~ с )) = 23 а ы с і — 23 а к/і = ь к - Ь ь = °- 

/=1 /=1 /=1 

Из этих теорем вытекает, что, найдя одно решение системы 
линейных неоднородных уравнений (5) й складывая его с каждым 
из решений приведенной системы (6), мы получим все решения 
системы (5). 



ГЛАВА ТРЕТЬЯ 
АЛГЕБРА МАТРИЦ 

§ 13. Умножение матриц 

В предшествующих главах понятие матрицы было использовано 
в качестве существенного вспомогательного, орудия при изучении 
систем линейных уравнений. Многочисленные другие применения 
этого понятия сделали его предметом большой самостоятельной тео- 
рии, во многих своих частях выходящей за пределы нашего курса. 
Мы займемся сейчас основами этой теории, начинающимися с того, 
что в множестве всех 'квадратных матриц данного порядка своеобраз- 
ным, но вполне мотивированным способом определяются две алге- 
браические операции — сложение и умножение. Мы начнем с опре- 
деления умножения матриц; сложение матриц будет введено в § 15. 

Из курса аналитической геометрии известно, что при повороте 
осей прямоугольной системы координат на плоскости на угол ос 
координаты точки преобразуются по следующим формулам: 

х—х' соза — у' зіп ос, 
у—х' зіп а-\-у' созос, 

где х, у — старые координаты точки, х', у' — ее новые координаты; 
таким образом, х и у выражаются через х' и у' линейно с некото- 
рыми числовыми коэффициентами. Во многих других случаях также 
приходится встречаться с заменой неизвестных (или переменных), 
при которой старые неизвестные линейно выражаются через новые; 
такую замену неизвестных называют обычно их линейным преобра- 
зованием (или линейной подстановкой). Мы приходим, следовательно, 
к такому определению: 

Линейным преобразованием неизвестных называется такой пере- 
ход от системы п неизвестных х ІУ х 2 , . . ., х п к системе п неизве- 
стных у ъ у 2 , . . ., у пг при котором старые неизвестные выражаются 
через новые линейно с некоторыми числовыми коэффициентами: 

х і ~ а и У і + а і2^2 + • • ■ + а 1п У п , ) 
х г — а иУі а ччУ 2 ~г ■ ■ ■ + а 2 пУп’ I 


= «пі-Уі + а пгУг + • • • + а пп Уп- 
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Линейное преобразование (1) вполне определяется своей матри- 
цей из коэффициентов 

а п а і2 * • • а 1л\ 
а 21 а г 2 • • • °2 п \ 

а п1 °п2 * * • а пп/ 

так как два линейных преобразования с одной и той же матрицей 
могут отличаться друг от друга лишь буквами, принятыми для обо- 
значения неизвестных; мы будем считать, одйако, что выбор этих 
обозначений целиком находится в нашем распоряжении. Обратно, 
задавая произвольную матрицу я-го порядка, мы сейчас же можем 
написать линейное преобразование, для которого эта матрица служит 
матрицей коэффициентов. Таким образом, между линейными преоб- 
разованиями я неизвестных и квадратными матрицами я-го порядка 
существует взаимно однозначное соответствие, а поэтому всякому 
понятию, связанному с линейными' преобразованиями, и всякому свой- 
ству этих преобразований должно соответствовать аналогичное поня- 
тие или свойство, относящееся к матрицам. 

Рассмотрим вопрос о последовательном выполнении двух линей- 
ных преобразований. Пусть вслед за линейным преобразованием (1) 
выполнено линейное преобразование 

-Уі = Ь и г х + Ъ хг г г + . . . + Ь 1 п г п , 

У 2 — &21 г 1 + ^ 22^2 + • ■ • + ^2п г т 


Уп — Кі г і + ^п2 г 2 + • • • + 

переводящее систему неизвестных у\,у 2 , ...,у п в систему г х , г 2 , 
матрицу этого преобразования обозначим через В. Подставляя в (1) 
выражения для у х , у 2 , ...,у п из (2), мы придем к линейным выраже- 
ниям для неизвестных х х , х 2 , . . . , х п через неизвестные г г , г г , . . . , г п . 
Таким образом, результат последовательного выполнения двух 
линейных преобразований неизвестных снова будет линейным 
преобразованием. 

Пример. Результатом последовательного выполнения линейных пре- 
образований 

Х 1 — 3(/і — У 2, Уі = 21+ 2 г , 

Хг=Уі+бу 2 , у г = 4г г + 2г* 

будет линейное преобразование 

*і = 3(2 1 +г 2 )— (4г 1 + 2г г )=— г 1 + г г , 
х 2 = ( 2 ! + г 2 ) + 5 (4г х + 2г г ) =21г х + Пг 2 . 

Обозначим через С матрицу линейного преобразования, являюще- 
гося результатом последовательного выполнения преобразований (1) 
и (2), и найдем закон, по которому ее элементы с ік , і,к— 1, 2, . ..,я, 
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§ 13 ] 


выражаются через элементы матриц А и В. Коротко записывая пре- 
образования (1) и (2) в виде 

х і=Ѣ а ілУр / = 1 > 2 , • ••>«; У/= / =1 > 2 > •••> 

У = 1 * = і 


мы получим 


/=1 


6 = 1 


*<= 2«,7 2 V* =21 2 а ;А* і л *. 


*=і \/=і 


/ = 1, 2, . . п. 


Таким образом, коэффициент при г к в выражении для х іг т. е. эле- 
мент с ік матрицы С, имеет вид 

с ш = 2 а И Ь ік = а п ь п + а и ь 2 к + • ■ ■ + а іп Ь пк , (3) 

/= і 

элемент матрицы С, стоящий в і-й строке и к-м столбце, ра- 
вен сумме произведений соответственных элементов і-й строки 
матрицы А и К-го столбца матрицы В. 

Формула (3), дающая выражение элементов матрицы С через 
элементы матриц А и В, позволяет при заданных матрицах А и В 
сразу написать матрицу С, минуя рассмотрение линейных преобра- 
зований, соответствующих матрицам А и В. Этим путем всякой паре 
квадратных матриц л-го порядка ставится в соответствие однозначно 
определенная третья матрица. Можно сказать, что мы определили 
в множестве всех квадратных матриц л-го порядка алгебраическую 
операцию; она называется умножением матриц , а матрица С — 
произведением матрицы А на матрицу В: 

С = АВ. 


Еще раз сформулируем связь между линейными преобразованиями 
и умножением матриц: 

Линейное преобразование неизвестных, полученное в резуль- 
тате последовательного выполнения двух линейных преобразо- 
ваний с матрицами А и В, имеет своей матрицей коэффициен- 
тов матрицу АВ. 


Примеры. 

( 4 9 \ ( 1 - 3 \_ ( 4-1 + 9 -( — 2) 4 .(- 3 ) + 9 . 1 \ 

\ — 1 3 / V — 2 і) \(— !)•! + 3 .( — 2) ( — 1) • ( — 3)+3*І ) 



/2 0 1ч /—3 1 Оч /— 6 1 Зч 

2) ( -2 3 2 ) . ( 0 2 1 ) = ( 6 2 9 ). 

V 4-15/ Ч 0—13/ Ч — 12 —3 14/ 
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4) Найти результат последовательного выполнения линейных преобразо- 
ваний 

*1 = 5 ^1— #2+3%,, 
х 2 ^Уі—2уі, 
х 3 = 7 У 2 — Уз 

н 

Уі~ 2г 1 + г з> 

Уз== 2 г 5г 3 , 

У» = 2г 2 . 

Перемножая матрицы, получим: 

/5—1 3\ /2 О К /10 5 10ч 

( 1 — 2 0}Ло 1 - 5 ) = ( 2 —2 11 ], 

\0 7 —1/ \0 2 0/ \ О 5 —35/ 

поэтому искомое линейное преобразование имеет вид: 

х 1 — 10?! + 5г 2 + 1 0г 3 , 

■*а = 2г 1 — 2г 2 + 1 І 2 3> 
х 3 = 5г г — З5г 3 , 

Возьмем один из рассмотренных сейчас примеров умножения 
матриц, например 2), и найдем произведение тех же матриц, но 
взятых в обратном порядке: 

/—3 1 0\ / 2 0 1\ г — 8 3 — 1\ 

0 2 1.-2 3 2 1=4 0 5 9 ■ 

\ 0 — 1 Зу 4—15 / \ 14 — -6 13/ 

Мы видим, что произведение матриц зависит от порядка мно- 
жителей, т. е. умножение матриц некоммутативно. Этого, впро- 
чем, следовало ожидать, уже хотя бы потому, что в определение 
матрицы С, данное выше при помощи формулы (3), матрицы А и В 
входят неравноправным образом: в А берутся строки, в В — 
столбцы. 

Примеры неперестановочных матриц л-го порядка, т. е. матриц, 
произведение которых меняется при перестановке сомножителей, 
можно указать для всех л, начиная с л = 2 (матрицы второго по- 
рядка в примере 1) неперестановочны). С другой стороны, две дан- 
ные матрицы случайно могут оказаться перестановочными, как по- 
казывает следующий пример: 

/ 7 — 12\ /26 45 \ /26 45 \ / 7 — 12\ /2 3\ 

\ — 4 7 / ' 1 5 26 / == \ 1 5 26/ * \ — 4 7/ = ( ч 12/ - 

Умножение матриц ассоциативно; можно говорить, следова- 
тельно, об однозначно определенном произведении любого конеч- 
ного числа матриц л-го порядка, взятых (ввиду некоммутативности 
умножения) в определенном порядке. 
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Доказательство. Пусть даны три произвольные матрицы 
л-го порядка А, В и С. Запишем их следующим сокращенным спо- 
собом, указывающим общий вид их элементов: А = (а і; ), В=(Ь ,- у ), 
С==(с,у). Введем, далее, следующие обозначения: 

АВ=Ц=(и и ), вС=Ѵ=(ѵ и ), 

(АВ) С= $=*= (%), Л (ВС) = Г= (/, 7 ). 

Нам нужно доказать справедливость равенства (АВ) С— А (ВС), 
т. е. 8—Т. Однако 

П П 

и И — 2 а і к^кЬ ѵ к]~ ,2 

и поэтому, ввиду равенств 8= ІЮ, Т—АѴ, 

п п п 

8 іі ~ 2 а і і с і]~ 2 2 а і -Фы с Ч' 

1=1 1=ік=і 

п п п 

*І]— 2 а ік ѵ к/ = 2 2 а і к^к1 с в< 

к = 1 к= 1 /=і 

т. е. з и = і {/ при і ( у — 1 , 2, п. 

Дальнейшее изучение свойств умножения матриц требует привле- 
чения их определителей, причем мы условимся для краткости обо- 
значать определитель матрицы А через |Л|. Если читатель в каждом 
из рассмотренных выше примеров подсчитает определители пере- 
множаемых матриц и сравнит произведение этих определителей 
с определителем произведения заданных матриц, то обнаружит 
весьма любопытную закономерность, выражаемую следующей очень 
важной т е о р е м о й об умножении определителей: 

Определитель произведения нескольких матриц п-го порядка 
равен произведению определителей этих матриц. 

Достаточно доказать эту теорему для случая двух матриц. Пусть 
даны матрицы л-го порядка А = (а^) и В=(Ьц) и пусть АВ = 
= С=(с,у). Построим следующий вспомогательный определитель Д 
порядка 2л: в его левом верхнем углу поставим матрицу А, в пра- 
вом нижнем — матрицу В, весь правый верхний угол займем нулями 
и, наконец, по главной диагонали левого нижнего угла поставим 
число — 1, заняв все остальные места также нулями. Определитель Д 
имеет, следовательно, такой вид: 


а и о 12 . . 

О 

а 

О 

о 

. 0 

а п а гг • • 

■ а 2п 0 0 .. 

. 0 

&ПІ а п2 * • 

• а пп 0 0 . . 

. 0 

— 10 .. 

. 0 Ьц Ь 12 • • 

■ &1 п 

0 —1 .. 

0 6 2 і &2а * • 

■ Ьіп 

0 0 ... 

1 &ЛІ ^П2 • > 

Ьпп 
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Применение к определителю А теоремы Лапласа — разложение 
по первым я срокам — приводит к следующему равенству: 


Д = |Л|.|В|. (4) 

Попытаемся, с другой стороны, так преобразовать определитель А, 
не меняя его значения, чтобы все элементы Ь і/ , /, /= 1,2, . . . . , л, 
оказались замененными нулями. Для этой цели к (л+ 1)-му столбцу 
определителя А прибавим его первый столбец, умноженный на Ь п , 
второй, умноженный на Ь 21 , и т. д., наконец я-й столбец, умножен- 
ный на Ь п1 . Затем к (л + 2)-му столбцу определителя А прибавим 
первый столбец, умноженный на Ь 12 , второй, умноженный на Ь 22 , 
и т. д. Вообще, к (я+ у')- му столбцу определителя А, где у = 
= 1,2, . . . , л, мы прибавим сумму первых л столбцов, взятых, со- 
ответственно, с коэффициентами # 1; -, . . . , Ь пі . 

Легко видеть, что эти преобразования, не меняющие определи- 
теля, на самом деле приводят к замене всех*элементов Ь ц нулями. 
Одновременно вместо нулей, стоявших в правом верхнем углу опре- 
делителя, появятся следующие числа: на пересечении і- й строки 
и (я + /)-го столбца определителя, і, у = 1 , 2 _ . . . , л, будет стоять 
теперь число а п Ь х/ а і2 Ь 2/ + . . . +а іп Ь п/І равное, ввиду (3), эле- 
менту Сц матрицы С — АВ. Правый верхний угол определителя за-, 
нимает теперь, следовательно, матрица С: 



°12 

• • • °1я 

С 11 

с 12 • • 

с т 

°21 

°22 

• • • а 2 п 

С 21 

с 22 .. 

С 2 п 

®ПІ 

а п2 

• • • а пп 

С ПІ 

С П 2 • • 

с пп 

— 1 

0 

... 0 

0 

0 ... 

0 

0 

— 1 

... 0 

0 

0 ... 

0 

0 

0 

... — 1 

0 

0 ... 

0 


Применим еще раз теорему Лапласа, разлагая определитель по 
последним л столбцам. Дополнительный минор для минора | С\ равен 
( — I)", а так как минор | С| расположен в строках с номерами 
1 , 2, . . . , л и в столбцах с номерами я+ 1 , л + 2, . . . , 2л, причем 

1 “I - 2 — ... — (— л — {— (л — 1 ) — {— (л — 2) — {— ... — (— 2 л = 2л 1 2 -{- л, 
то 

Д = (_1)2« г +»(_ 1 )»{С| = (— 1) 2 ‘" г+п >|С| 


или, ввиду четности числа 2 (л 2 -(-л), 

Д = |С|, 


(5) 
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Из (4) и (5) вытекает, наконец, доказываемое равенство 

|С| = И|.|В|. 

Теорема об умножении определителей могла бы быть доказана 
и без использования теоремы Лапласа. Одно из таких доказательств 
читатель найдет в конце § 16. 


§ 14, Обратная матрица 

Квадратная матрица называется вырожденной (или особенной), 
если ее определитель равен нулю, и невырожденной (или неособен- 
ной) — в противоположном случае. Соответственно линейное преоб- 
разование неизвестных называется вырожденным или невырожден- 
ным в зависимости от того, будет ли равен нулю или отличен от 
нуля определитель из коэффициентов этого преобразования. Из 
теоремы, доказанной в конце предшествующего параграфа, выте- 
кают следующие утверждения: 

Произведение матриц, хотя бы одна из которых вырожденная, 
будет вырожденной матрицей. 

Произведение любых невырожденных матриц само будет не- 
вырожденной матрицей. 

Отсюда следует, ввиду связи, существующей между умножением 
матриц и последовательным выполнением линейных преобразований, 
такое утверждение: результат последовательного выполнения не- 
скольких линейных преобразований тогда и только тогда будет 
невырожденным преобразованием, если все заданные преобразо- 
вания невырожденные. 

Роль единицы в умножении матриц играет единичная мат- 
рица 



причем она перестановочна с любой матрицей А данного порядка, 

АЕ = ЕА=А. (1) 

Доказываются эти равенства или непосредственным применением 
правила умножения матриц, или же на основании замечания, что 
единичная матрица соответствует тождественному линейному пре- 
образованию неизвестных 


Хі=Уі, 

~ У 2 ' 


*п= Уп . 
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выполнение которого до или после любого другого линейного пре- 
образования, очевидно, не меняет этого последнего. 

Заметим, что матрица Е является единственной матрицей, 
удовлетворяющей условию (1) при любой матрице А. Действи- 
тельно, если бы существовала еще матрица Е' с этим же свойством, 
то мы имели бы 

Е'Е = Е\ Е'Е = Е, 

откуда Е' =Е. 

Вопрос о существовании для данной матрицы А обратной ма- 
трицы оказывается более сложным. Ввиду некоммутативности умно- 
жения матриц мы будем говорить сейчас о правой обратной ма- 
трице, т. е. о такой матрице А -1 , что произведение матрицы А 
справа на эту матрицу дает единичную матрицу, 

АА —Е. (2) 


Если матрица А вырожденная, то, если бы матрица А~ г существо- 
вала, произведение, стоящее в левой части равенства (2), было бы, 
как мы знаем, вырожденной матрицей, в то время как на самом 
деле матрица Е, стоящая в правой части этого равенства, является 
невырожденной, так как ее определитель равен единице. Таким об- 
разом, вырожденная матрица не может иметь правой обратной ма- 
трицы. Такие же соображения показывают, что она не имеет и левой 
обратной и поэтому для вырожденной матрицы обратная матрица 
вообще не существует. 

Переходя к случаю невырожденной матрицы, введем сначала 
следующее вспомогательное понятие. Пусть дана матрица л-го по- 
рядка 


Матрица 



составленная из алгебраических дополнений к элементам матрицы А, 
причем алгебраическое дополнение к элементу ац стоит на пересе- 
чении у-й строки и /-То столбца, называется присоединенной (или 
взаимной) матрицей к матрице А. 

Найдем произведения АА* и А* А. Используя известную из § 6 
формулу разложения определителя по строке или столбцу, а также 
теорему из § 7 о сумме произведений элементов любой строки 
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(столбца) определителя на алгебраические дополнения к соответствен- 
ным элементам другой строки (столбца), и обозначая через й опре- 
делитель матрицы А, 

а=\А\, 


мы получим следующие равенства: 


АА*=А*А-. 


/а о .... о\ 
о а ... о 

ѵО о ... й) 


( 3 ) 


Отсюда вытекает, что если матрица А невырожденная, то ее 
присоединенная матрица А* также будет невырожденной, причем 
определитель <1* матрицы А* равен (п — 1)-м степени определи- 
теля й матрицы А. 

В самом деле, переходя от равенств (3) к равенству между опре- 
делителями, мы получим 

<Ы* — а п , 

откуда ввиду йф О 

а*=а п - “). 


Теперь легко доказать существование обратной матрицы для 
всякой невырожденной матрицы А и найти ее вид. Заметим 
сначала, что если мы рассмотрим произведение двух матриц АВ 
и все элементы одного из множителей, например В, разделим на 
одно и то же число й, то все элементы произведения АВ также 
разделятся на это же число: для доказательства нужно лишь вспо- 
мнить определение умножения матриц. Таким образом, если 

а~\А\фО, 

то из равенств (3) вытекает, что обратной матрицей для А будет 
служить матрица, получающаяся из присоединенной матрицы А* 
делением всех ее элементов на число й\ 



Мы 

Аг і 

А п \ \ 


' а 

а 

••• а \ 


А 12 

Л 2 2 

А п 2 


а 

а 

"• а 


\ л 1а 

А 2 п 

А пп / 


\ а 

а 

••• а 1 

доказать, что 

если 

матрица , 


присоединенная матрица 
превосходящий числа 1. 


А* также вырожденная, 


1 вырожденная, то и ее 
причем имеет ранг, не 
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Действительно, из (3) вытекают равенства 

АА- 1 = А~ 1 А*=Е. (4) 

Еща раз подчеркнем, что в /-Й строке матрицы А~ 1 стоят 
алгебраические дополнения к элементам /-го столбца определи- 
теля | А |, деленные на й = [Л[. 

Легко доказать, что матрица А~ х является единственной 
матрицей, удовлетворяющей условию (4) для данной невырожденной 
матрицы А. Действительно, если матрица С такова, что 




то 


САА- 1 = С (ЛЛ" 1 ) = СЕ = С, 

САА~ 1 = (СА) Л" 1 - ЕА~ г = А- 1 , 

откуда С = А~ 1 . 

Из (4) и теоремы об умножении определителей вытекает, что 

определитель матрицы Л -1 равен -і , так что эта матрица также 

I I 

будет невырожденной; обратной для нее служит матрица А. 

Если теперь даны квадратные матрицы л-го порядка Л и В, из 
которых Л — невырожденная, а В — произвольная, то мы можем 
выполнить правое и левое деления В на А, т. е. решить матрич- 
ные уравнения 

АХ = В, УА = В. (5) 


Для этого, ввиду ассоциативности умножения матриц, достаточно 
положить 

Х = Л- 1 В, У — ВА~ 1 , 

причем эти решения уравнений (5) будут, ввиду некоммутативности 
умножения матриц, в общем случае различными. 

Примеры. 1) Дана матрица 



Ее определитель |Л|=5, поэтому обратная матрица Л -1 существует, 
причем 
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2) Даны матрицы 



Матрица А невырожденная, причем 



поэтому решениями уравнений АХ*=В, УА = В будут служить матрицы 



Умножение прямоугольных матриц. Хотя умножение матриц 
определено в предшествующем параграфе лишь для квадратных 
матриц одинакового порядка, но его можно распространить и на 
случай прямоугольных матриц А и В , если только можно применить 
формулу (3) предшествующего параграфа, т. е. если всякая строка 
матрицы А содержит столько же элементов, сколько их во всяком 
столбце матрицы В. Иными словами, можно говорить о произве- 
дении прямоугольных матриц А и В в том случае, если число 
столбцов матрицы А равно числу строк матрицы В, причем 
число строк матрицы АВ равно числу строк матрицы А, число 
же столбцов матрицы АВ равно числу столбцов матрицы В. 


Примеры. 


1) 

2) 

3 ) 


/-1 

3 

°\ 



1 3 1\ / — 2 

1 

1 р° 

15 

-5\ 

0 — 1 \) ' 3 

0 

-2 \Д1 

10 

ю; 

V 4 

1 

2/ 





Умножение прямоугольных матриц можно связать с последова- 
тельным выполнением линейных преобразований неизвестных, если 
только в определении последних отказаться от предположения, что 
число неизвестных сохраняется при линейном преобразовании. 

Легко проверить также, дословно повторяя доказательство, 
данное выше для случая квадратных матриц, что закон ассоциа- 
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тивности остается справедливым и для умножения прямоугольных 
матриц. 

Мы воспользуемся сейчас умножением прямоугольных матриц 
и свойствами обратной матрицы для нового вывода правила 
Крамера, не требующего тех громоздких вычислений, какие 
проводились в § 7. Пусть дана система п линейных уравнений 
с п неизвестными: 

а 21 Х 1~\- а ъъ х ъ~\~ • • • а -2п х п = ^2> I ^ 

а пі х і + а п2 х 2 + . . . + а пп х п =Ь п , \ 

причем определитель этой системы отличен от нуля. Обозначим 
через А матрицу из коэффициентов системы (6); эта матрица невы- 
рожденная, так как, по предположению, й—\А\Ф0. Обозначим 
далее через X столбец из неизвестных, через» В — столбец из сво- 
бодных членов системы (6), т„ е. 



Произведение АХ имеет смысл, так как число столбцов матрицы А 
равно числу строк матриц X, причем это произведение будет столб- 
цом, составленным из левых частей уравнений системы (6). Таким 
образом, систему (6) можно записать в виде одного матричного 
уравнения 

АХ— В. (7) 

Умножая обе части уравнения (7) слева на матрицу А~ х , сущест- 
вование которой вытекает из невырожденности квадратной матри- 
цы А, мы получим: 

Х=А~ 1 В. (8) 

Произведение, стоящее справа, будет матрицей из одного столбца; 
ее у-й элемент равен сумме произведений элементов у-й строки 
матрицы А~ х на соответственные элементы матрицы В, т. е. равен 
числу 

^2 + • • • + ~7гЬ п = -Д [А 1 ]Ь 1 + А 2 уЬ 2 + А п /Ь п )- 

Скобка, стоящая справа, является, однако, разложением по у-му 
столбцу определителя й ., получающегося заменой у-го столбца опре- 
делителя д. столбцом В. Таким образом, формулы (8) равносильны 
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формулам (3) из § 7, выражающим решение системы (6), получаю- 
щееся по правилу Крамера. 

Остается показать, что полученные значения неизвестных дейст- 
вительно составляют решение системы (6). Для этого достаточно 
выражение (8) подставить в матричное уравнение (7), что, очевидно, 
приводит к тождеству В— В. 

Ранг произведения матриц. Теорема об умножении определите- 
лей не приводит в случае вырожденных матриц ни к какому выска- 
зыванию сверх того, что их произведение также будет вырожденным, 
хотя вырожденные квадратные матрицы можно еще различать по их 
рангам. Заметим, что не существует вполне определенной зависимости 
между рангами сомножителей и рангом произведения, как показы- 
вают следующие примеры: 



/2 0 \ /0 0 \ /0 0 \ 
\о * ѵ° з;~ Ѵо О)' 


в обоих случаях перемножаются матрицы ранга 1, однако в одном 
случае произведение имеет ранг 1, в другом — ранг 0. Справедлива, 
притом не только для квадратных, но и для прямоугольных матриц, 
лишь следующая теорема. і 

Ранг произведения матриц не выше ранга каждого из сомно- 
жителей. 

Достаточно доказать эту теорему для случая двух множителей. 
Пусть даны матрицы А и 8, для которых произведение АВ имеет 
смысл; обозначим АВ = С. Рассмотрим формулу (3) § 13, дающую 
выражение элементов матрицы С. Беря эту формулу для данного к 
и всех возможных і (і = 1, 2, ...), мы получаем, что к- й столбец 
матрицы С является суммой всех столбцов матрицы А, взятых с не- 
которыми коэффициентами (а именно с коэффициентами Ь хк , Ь 2к , . . .). 
Этим доказано, что система столбцов матрицы С линейно выражается 
через систему столбцов матрицы А, а поэтому, как показано в § 9, 
ранг первой системы меньше или равен рангу второй системы; иными 
словами, ранг матрицы С не больше ранга матрицы А. Так как, 
с другой стороны, из той же формулы (3) § 13 при данном і и 
всех к вытекает, что всякая і- я строка матрицы С является линейной 
комбинацией строк матрицы В , то аналогичными рассуждениями мы 
получим, что ранг С не выше ранга В. 

Более точный результат имеет место для случая, -когда один из 
множителей является невырожденной квадратной матрицей: 

Ранг -произведения произвольной матрицы А справа или слева 
на невырожденную квадратную матрицу С} равен рангу матрицы А. 

Пусть, например, 


Ж?=С. 


( 9 ) 
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Из предшествующей теоремы следует, что ранг матрицы С не выше 
ранга матрицы А. Умножая, однако, равенство (9) справа на <2 -1 , 
мы придем к равенству 

А=СС>~\ 

а поэтому, снова на основании предшествующей теоремы, ранг А 
не выше ранга С. Сопоставление этих двух результатов доказывает 
совпадение рангов матриц А и С. 

§ 15, Сложение матриц и умножение матрицы на число 

Для квадратных матриц порядка п следующим образом опреде- 
ляется сложение: 

Суммой А А- В двух квадратных матриц А = (а,у) и В = (Ь і] ) 
порядка п называется матрица С=(с (; -), всякий элемент которой 
равен сумме соответственных элементов матриц А и В; 

с і] ~ а і/ + ь ц *)• 

Определенное нами сложение матриц будет, очевидно, коммута- 
тивным и ассоциативным. Для него существует обратная операция — 
вычитание, причем разностью матриц Л и В служит матрица, состав- 
ленная из разностей соответственных элементов заданных матриц. 
Роль нуля играет при этом нулевая матрица, составленная сплошь 
из нулей; в дальнейшем эта матрица обозначается символом 0: нет 
серьезной опасности смешать нулевую матрицу с числом нуль. 

Сложение квадратных матриц и цх умножение, определенное 
в § 13, связаны законами дистрибутивности. 

В самом деле, пусть даны три матрицы порядка п, А — (йц), 
В=(Ьц), С — (Сц). Тогда для любых і и у имеет место очевидное 
равенство 

2 (®і с я/ 2 Я/, с , / 2 

5=1 5 = 1 5=1 

Однако левая часть этого равенства есть элемент, стоящий в /- й 
строке и у'-м столбце матрицы {А +В) С, правая часть — элемент, 
стоящий на этом же месте в матрице АС-\-ВС. Этим доказано 
равенство 

(А + В)С = АС+ВС. 

Равенство С ( А + В) = С А СВ доказывается таким же путем — 
некоммутативность умножения матриц требует, понятно, доказа- 
тельства этих обоих законов дистрибутивности. 

г ) Можно было бы, конечно, и произведение матриц определить столь же 
естественным способом, перемножая соответственные элементы. Такое умно- 
жение, однако, в отличие от того, которое определено в § 13, не нашло бы 
никаких серьезных применений. 
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Введем следующее определение умножения матриц на число. 

Произведением кА квадратной матрицы А = (а і ^) на число к 
называется матрица А' = (а'.), получающаяся умножением на к всех 
элементов матрицы А; 

'а'ц—кау. 

С одним примером такого умножения матрицы на число мы уже 
встречались в предшествующем параграфе: если матрица А невырож- 
денная, причем \А\ = й, то ее обратная матрица А~ 1 и присоеди- 
ненная матрица А* связаны равенством 

А~ х = й-'А*. 

Как мы знаем, всякую квадратную матрицу порядка п можно рас- 
сматривать как я 2 -мерный вектор, причем это соответствие между 
матрицами и векторами взаимно однозначное. Определенные сейчас 
сложение„матриц и умножение матрицы на число превращаются при 
этом в сложение векторов и умножение вектора на число. Таким 
образом, совокупность квадратных матриц порядка п можно 
рассматривать как п 2 -мерное векторное пространство. 

Отсюда вытекает справедливость следующих равенств (здесь А, 
В — матрицы порядка п\ к, I — числа, 1 — число единица): 


к(А + В)=кА + кВ, 

0) 

(к+1)А = кА + 1А, 

(2) 

к (ІА) = (кі) А, 

(3) 

Ь А = А. 

(4) 


Свойства (1) и (2) связывают умножение матрицы на число со 
сложением матриц. Существует, вместе с тем, очень важная связь 
между умножением матрицы на число и перемножением самих 
матриц, а именно: 

(кА) В — А (кВ) = к (АВ ) , (5) 

т. е. если в произведении матриц один из множителей умно- 
жается на число к, то и все произведение будет умножаться на к. 

В самом деле, пусть даны матрицы А — (а^) и В=(Ь І} ) и число к. 
Тогда для любых і и у будет: 

2 ( ка и) = * 2 «, -А/. 

8=1 5=1 

Левая часть этого равенства есть, однако, элемент, стоящий в г-й 
строке и /-м столбце матрицы (кА) В, правая часть — элемент, 
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стоящий на этом же месте в матрице к{АВ). Этим доказано равенство 

(кА) В= к (АВ). 

Равенство А(кВ) = к(АВ) доказывается таким же путем. 

Операция умножения матрицы на число позволяет ввести новый 
способ записи матриц. Обозначим через Е і{ матрицу, в которой на 
пересечении і - й строки и /-го столбца стоит единица, а все осталь- 
ные элементы равны нулю. Полагая г = 1,2, ■ , . , п и /== 1, 2, , . ., п, 
мы получим л 2 таких матриц Е^, которые связаны, как легко про- 
верить, следующей таблицей умножения: 

ад/ = ° П Р И 

Матрица кЕц отличается от матрицы Е ,-у лишь тем, что в ней на 
пересечении і-й строки и /-го столбца стоит число к. Учитывая это 
и используя определение сложения матриц, мы получаем следующую 
запись для произвольной квадратной матрицы А: 



причем матрица А обладает, очевидно, лишь единственной записью 
вида (6). 

Матрица кЕ, где Л: — единичная матрица, имеет, по определению , 
умножения матрицы на число, следующий вид: 



т. е. на главной диагонали стоит одно и то же число к, а все эле- 
менты вне этой диагонали равны нулю. Такие матрицы называются 
скалярными. 

Определение сложения матриц приводит к равенству 

кЕ + 1Е=:(к + 1)Е. (7) 

С другой стороны, используя определение умножения матриц или 
же опираясь на равенство (5), получаем: 

кЕ‘1Е— (кГ) Е. . (8) 

Умножение матрицы А на число к можно истолковать как 
умножение А на скалярную матрицу кЕ в смысле перемножения 
матриц. Действительно, по (5), 

(кЕ)А = А(кЕ) = кА. 
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Отсюда вытекает также, что всякая скалярная матрица пере- 
становочна с любой матрицей А. Очень важно, что скалярные 
матрицы являются единственными, обладающими этим свойством: 

Если некоторая матрица С=(с і; ) п-го порядка перестановочна 
с любой матрицей этого же порядка, то матрица С скалярна. 

В самом деле, положим і Ф ] и рассмотрим равные между собой, 
по условию, произведения СЕ ц и Е^С (см. выше определение мат- 
рицы Ец). Легко видеть, что все столбцы матрицы СЕц, кроме у'-го, 
состоят из нулей, а у'-й столбец совпадает с / м столбцом матрицы С; 
в частности, на пересечении і - й строки и у'-го столбца матрицы СЕ { , 
стоит элемент с п . Аналогично все строки матрицы Е^С, кроме і- й, 
состоят из нулей, а і - я строка совпадает с у'-й строкой матрицы С; 
на пересечении г-й строки и у'-го столбца матрицы Е^С расположен 
элемент с ц. Используя равенство СЕц = ЕцС, мы получаем, что 
с іі *=с^^ (как элементы, стоящие в равных между собой матрицах на 
одинаковых местах), т. е. все элементы главной диагонали мат- 
рицы С равны между собой. С другой стороны, на пересечении у'-й 
строки и у’-го столбца матрица СЕ^ стоит элемент Сц\ но в мат- 
рице ЕцС на этом же месте стоит нуль (ввиду і Ф у), и поэтому 
с 1і = 0, т. е. всякий элемент матрицы С, расположенный вне глав- 
ной диагонали, равен нулю. Теорема доказана. 

§ 16*. Аксиоматическое построение теории определителей 

Определитель л-го порядка является числом, однозначно опреде- 
ляемым данной квадратной матрицей л-го порядка. Определение 
этого понятия, приведенное в § 4, указывает правило, по которому 
определитель выражается через элементы заданной матрицы. Это 
конструктивное определение можно, однако, заменить аксиоматиче- 
ским; можно, иными словами, среди свойств определителя, устано- 
вленных в §§ 4 и 6, указать такие, что единственной функцией 
матрицы с действительными значениями, обладающей этими свой- 
ствами, будет ее определитель. 

Простейшее определение такого рода состоит в использовании 
разложений определителя по строке. Рассматриваем квадратные мат- 
рицы любых порядков и предполагаем, что всякой такой матрице М 
поставлено в соответствие число сі м , причем выполняются следую- 
щие условия: 

1) Если матрица М первого порядка, т. е. состоит из одного 
элемента а, то й^—а. 

2) Если первую строку матрицы л-го порядка М составляют эле- 
менты а 1ѵ а 12 , ..., а 1п и если через, М ( і=1, 2, обозна- 

чена матрица (п — 1)-го порядка, остающаяся после вычеркивания 
из М первой строки и і-го столбца, то 

— а 11^ДІ 1 а і2^м, ~Ь а із^ді 3 • • • ~М 1)" 1а іп^м.п • 
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Тогда для всякой матрицы М число й п равно определителю 
этой матрицы. Мы предоставляем читателю доказательство этого 
утверждения, проводящееся индукцией по л и использующее 
результаты § 6. 

Много более интересны другие формы аксиоматического опреде- 
ления определителя, относящиеся к случаю лишь одного данного 
порядка п и имеющие в своей основе некоторые из установленных 
в § 4 простейших свойств определителя. Мы приступим сейчас 
к рассмотрению одного из таких определений. 

Пусть всякой квадратной матрице М п - го порядка поставлено 
в соответствие число причем выполняются следующие условия: 

I. Если одна из строк матрицы М умножается на число к, 
то число сі м также умножается на к. 

II. Число не меняется, если к одной из строк матрицы М 
прибавляется другая строка этой матрицы. 

III. Если Е — единичная матрица, то й Е =\, 

Докажем, что для любой матрицы М чёсло д м равно опреде- 
лителю этой матрицы. 

Выведем сначала из условий I — III некоторые свойства числа й м , 
аналогичные соответствующим свойствам определителя. 

(1) Если одна из строк матрицы М состоит из нулей, то 
а м~®- 

В самом деле, умножая строку, состоящую из нулей, на число 0, 
мы не меняем матрицу, но, ввиду условия I, число приобре- 
тает множитель 0. Поэтому 

гі м = °- — 0. 

(2) Число не меняется, если к і-й строке матрицы М 
прибавляется ее }-я строка, у'=?М. умноженная на число к. 

Если к — 0, то все доказано. Если же 6=^0, то умножаем у-ю 
строку на к и получаем матрицу М ' , для которой, ввиду условия I, 
<1 М ' — кй м . Затем к і-й строке матрицы М' прибавляем ее у-ю 
строку и получаем матрицу М", причем, ввиду условия II, й м -. 

Наконец, умножаем у-ю строку матрицы М" на число к" 1 . Мы 
приходим к матрице М" , которая в действительности получена из Ж 
преобразованием, указанным в формулировке доказываемого свой- 
ства, причем 

д-м — к дм " — к ^дм'^^к ^ ' к 

(3) Если строки матрицы М линейно зависимы, то й 1Л = 0. 

Действительно, если одна из строк, например і- я, будет линей- 
ной комбинацией других строк, то, применяя несколько раз пре- 
образование (2), можно і-ю строку заменить строкой из нулей. 
Преобразование (2) не меняет числа а поэтому ввиду свой- 
ства (1) 
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(4) Если і-я строка матрицы М является суммой двух век- 
торов р и у и если матрицы М' и М." получены из матрицы М 
заменой ее і-й строки соответственно векторами $ и у, то 

В самом деле, пусть 5 будет система всех строк матрицы М, 
кроме і-й. Если в 5 существует линейная зависимость, то линейно 
зависимы строки каждой из матриц М, М' и М", а поэтому, по 
свойству (3), = йм' = йм” = 0, откуда следует справедливость 
в этом случае доказываемого свойства. Если же система 5, состоя- 
щая из п — 1 вектора, линейно независима, то, как показывают 
результаты § 9, ее можно дополнить некоторым вектором а до макси- 
мальной линейно независимой системы векторов л-мерного вектор- 
ного пространства. Через эту систему можно линейно выразить век- 
торы Р и Пусть вектор а входит в эти выражения с коэффициен- 
тами к и, соответственно, /; в выражение для вектора р+Ѵі т - е - 
для і-й строки матрицы М , вектор а будет входить, следовательно, 
с коэффициентом к-\-1. Матрицы М, М' и М" можно теперь пре- 
образовать, вычитая из их і-х строк некоторые линейные комбина- 
ции других строк так, что их і-ми строками будут служить соот- 
ветственно векторы (&-{-/) а, кос и /а. Поэтому, обозначая через М° 
матрицу, получающуюся из матрицы М заменой ее і-й строки век- 
тором а, и учитывая свойства (2) и I, мы приходим к равенствам: 

й м — + 0 <ім°і <ім' ==к(ім°, йм” — Мм 1 ‘- 

Этим свойство (4) доказано. 

(5) Если матрица М получена из матрицы М транспозицией 
двух строк, то = — й м . 

Пусть, в самом деле, в матрице М нужно переставить строки 
с номерами і и у. Этого можно достичь цепочкой следующих пре- 
образований: сначала к і-й строке матрицы М прибавляем ее у'-ю 
строку и получаем матрицу М , причем, по условию И, йм'=-Л п . 
Затем из у- й строки матрицы М вычитаем ее і-ю строку и прихо- 
дим к матрице М", для которой, ввиду свойства (2), будет йм" — йы'\ 
/'-я строка матрицы М" будет отличаться знаком от і-й строки 
матрицы М. Прибавим теперь к і-й строке матрицы М' ее у'-ю 
строку. Для матрицы М'”, которую мы получим этим преобразова- 
нием, будет, по условию II, й м'" — йм”, причем і-я строка этой 
матрицы совпадет с у-й строкой матрицы М. Умножая, наконец, 
у'-ю строку матрицы М" на число — 1, мы придем к искомой мат- 
рице М. Поэтому, ввиду условия I, 

а М ~ ^М”' = а м- 
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(6) Если матрица М' получена из матрицы М перестановкой 
строк , причем і-й строкой матрицы М', і— 1,2, п, служит 
а ( -я строка матрицы М, то 

йм' — і 

при этом знак плюс соответствует случаю, когда подстановка 

С 2 -") 

четна, знак минус — случаю , когда она нечетна. 

В самом деле, матрица М' может быть получена из матрицы М 
некоторым числом транспозиций двух строк, и поэтому можно вос- 
пользоваться свойством (5). Четность числа этих транспозиций опре- 
деляет, как известно из § 3, четность указанной выше подстановки. 

Рассмотрим теперь матрицы М= (а^), Л/= (&; ,) и их произведе- 
ние (1—МЫ в смысле § 13. Найдем число Мы знаем, что вся- 
кая і- я строка матрицы (} является суммой всех строк матрицы Ы, 
взятых соответственно с коэффициентами а іъ а І2 , а іп (см., на- 
пример, § 14). Заменим все строки матрицы С} их указанными ли- 
нейными выражениями через строки матрицы N и воспользуемся 
несколько раз свойством (4). Мы получим, что число будет 
равно сумме чисел й Т для всевозможных матриц Т следующего вида: 
/- я строка матрицы Т,і = 1,2, .... л, равна а г й строке матрицы ./V, 
умноженной на число а Мі . При этом ввиду свойства (3) можно исклю- 
чить из рассмотрения все матрицы Т, для которых существуют такие 
индексы і и у, /= 7 ^=/, что а^ау, остаются, иными словами, лишь 
такие матрицы Т, для которых индексы а г , а 2 , ...,а„ составляют 
перестановку чисел 1, 2, . .., п. Ввиду свойств 1 и (6) число й т 
для такой матрицы имеет вид 

й т = і а іа, а га.2 • • • а па п 

где знак определяется четностью подстановки из индексов. Отсюда 
мы приходим к выражению для числа после вынесения за скобки 
из всех слагаемых вида й т общего множителя в скобках остается, 
очевидно, определитель ( М | матрицы М в смысле конструктивного 
определения, данного в § 4, т. е. 

а^\м\-а„. (*) 

Если мы возьмем теперь в качестве матрицы N единичную мат- 
рицу Е, то будет (3 = М и, по свойству III, д ЕГ —й Е —\, т. е. для 
любой матрицы М имеет место равенство 

^м~ 1 ^ 1 » 

что и требовалось доказать. Одновременно еще раз, при- 
том без использования теоремы Лапласа, доказана 
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теорема об умножении определителей: для этого до- 
статочно в равенстве (*) заменить числа йд и определителями 
соответствующих матриц. 

Закончим эти аксиоматические рассмотрения доказательством 
независимости условий 1 — III, т. е. доказательством того, 
что ни одно из этих условий не является следствием двух других. 

Для доказательства независимости условия III положим, что 
а м = о для всякой матрицы М л-го порядка. Условия I и II будут, 
очевидно, выполняться, условие же III нарушается. 

Для доказательства независимости условия II положим, что для 
всякой матрицы М число й м равно произведению элементов, стоя- 
щих на главной диагонали этой матрицы. Условия I и III выпол- 
няются, а условие II уже не имеет места. 

Наконец, для доказательства независимости условия I положим, 
что й м =\ для всякой матрицы М. Условия II и III будут при 
этом выполняться, а условие I нарушается. 



ГЛАВА ЧЕТВЕРТАЯ 

КОМПЛЕКСНЫЕ ЧИСЛА 

§ 17. Система комплексных чисел 

На протяжении курса элементарной алгебры несколько раз проис- 
ходит обогащение запаса чисел. Школьник, приступающий к изуче- 
нию алгебры, приносит из арифметики знакомство с положительными 
целыми и дробными числами. Алгебра начинается по существу 
с введения отрицательных чисел, т. е. с оформления первой среди 
важнейших числовых систем — системы целых чисел, состоящей из 
всех положительных и всех отрицательных целых чисел и нуля, и 
более широкой системы рациональных чисел, состоящей из всех 
целых чисел и всех дробных чисел, как положительных, так и от- 
рицательных. 

Дальнейшее расширение запаса чисел происходит тогда, когда 
в рассмотрение вводятся иррациональные числа. Система, состоя- 
щая из всех рациональных и всех иррациональных чисел, называется 
системой действительных (или вещественных) чисел. Строгое по- 
строение системы действительных чисел содержится обычно в уни- 
верситетском курсе математического анализа; для нас, однако, 
было достаточно в предшествующих главах и будет достаточно 
в дальнейшем того знакомства с действительными числами, каким 
обладает читатель, приступающий к изучению высшей алгебры. 

Наконец, в самом конце курса элементарной алгебры система 
действительных чисел расширяется до системы комплексных чисел. 
Эта система чисел остается для читателя менее привычной, конечно, 
чем система действительных чисел, хотя на самом деле она обла- 
дает многими очень хорошими свойствами. В настоящей главе 
будет еще раз с необходимой полнотой изложена теория комплекс- 
ных чисел. 

Комплексные числа вводятся в связи со следующей задачей. 
Известно, что действительных чисел недостаточно для того, чтобы 
решить любое квадратное уравнение с действительными коэффи- 
циентами. Простейшее из квадратных уравнений, не имеющих 
корней среди действительных чисел, есть 

* а + 1 = 0; (1) 
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только это уравнение будет нас сейчас интересовать. Задача, стоя- 
щая перед нами, такова: нужно расширить систему действитель- 
ных чисел до такой системы чисел, в которой уравнение (1) 
уже обладало бы корнем. 

В качестве материала, из которого будет строиться эта новая 
система чисел, мы возьмем точки плоскости. Напомним, что изо- 
бражение действительных чисел точками прям'ой линии (основанное 
на том, что мы получаем взаимно однозначное соответствие между 
множеством всех точек прямой и множеством всех действительных 
чисел, если при заданном начале координат и единице масштаба 
всякой точке прямой поставим в соответствие ее абсциссу) систе- 
матически используется во всех отделах математики и является 
столь привычным, что обычно мы -не делаем различия между дей- 
ствительным числом и точкой, его изображающей. 

Таким образом, мы хотим определить систему чисел, изо- 
бражающихся всеми точками плоскости. До сих пор нам не при- 
ходилось складывать или перемножать точки плоскости, поэтому 
определение операций над точками мы имеем право выбирать, 
заботясь лишь о том, чтобы новая система чисел обладала всеми 
теми свойствами, ради которых мы ее создаем. Эти определения, 
особенно для произведения, покажутся в первый момент весьма 
искусственными. В гл. 10 будет показано, однако, что никакие 
другие определения операций, на первый взгляд даже 
более естественные, не привели бы нас к цели, т. е. к по- 
строению расширения системы действительных чисел, содержащего 
корень уравнения (1). Там же будет показано, что замена точек 
плоскости в этом построении любым другим мате- 
риалом не привела бы к системе чисел, по своим 
алгебраическим свойствам отличающейся от той си- 
стемы комплексных чисел, которая строится ниже. 

Пусть на плоскости выбрана прямоугольная система координат. 
Условимся обозначить точки плоскости буквами ос, Р, у, . . . и за- 
писывать точку а с абсциссой а и ординатой Ь через (а, Ь), т. е., 
несколько отступая от того, что принято в аналитической геомет- 
рии, писать а ~(а, Ь). Если даны точки о с=(а, Ь) и |3 = (с, д), то 
суммой этих точек мы будем называть точку с абсциссой а + с 
и ординатой Ь^й, т. е. 

(а,Ь) + {с,а) = {а + с,Ь + й)-, (2) 

произведением точек а=(а,Ь) и р=(с, д) мы будем называть 
точку с абсциссой ас — Ьй и ординатой ад-\-Ьс, т. е. 

{а, Ь){с, й) = (ас — М, ай-{-Ьс). (3) 

Этим путем мы определили в множеств всех точек плоскости 
две алгебраические операции. Покажем, что эти операции обла- 
дают всеми основными свойствами, какими обладают операции 
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в системе действительных чисел или в системе рациональных 
чисел: они обе коммутативны и ассоциативны, связаны законом 
дистрибутивности и для них существуют обратные операции — 
вычитание и деление (кроме деления на нуль). 

Коммутативность и ассоциативность сложения очевидны (точнее, 
вытекают из соответствующих свойств сложения действительных 
чисел), так как при сложении точек плоскости мы отдельно скла- 
дываем их абсциссы и отдельно ординаты. Коммутативность умно- 
жения основана на том, что в определение произведения точки а 
и р входят симметричным образом. Ассоциативность умножения 
доказывают следующие равенства: 

[(а, Ь) (с, <*)] (е, /) = {ас — Ьд, ад/- Ьс) (е, /) = 

— (асе — Ьде — ад/ — Ьс/, ас/ — Ьд/-\- аде + Ьсе), 

(а, Ь) [(с, д) (е, /)] = (а, Ь) (се—д/, с/+ де) = 

" = (асе — ад/ — Ьс/ — Ьде , ас/ -}- аде + Ьсе — Ьд/). 

Закон дистрибутивности вытекает из равенств 
[(а, 6) + (с, й?)] (е, /) = (а + с, Ь + д) (е, /) = 

~(ае/-се—Ь/—д/, а/ /-с/ /-Ье/- де), 

(а, Ь) (е, /) + (с,д)(е,/) = (ае — Ь/, а//- Ье) + (се — д/, с//- де) = 
-(ае — Ь//-се — д/, а/ Ье -)- с/+ де). 

Рассмотрим вопрос об обратных операциях. Если даны точки 
а = (а, Ь) и р = (с, д), то их разностью будет такая точка (х, у), что 

(с, <*) + (*, у) = (а, Ь). 

Отсюда, ввиду (2), 

с~{-х — а, д-\-у — Ь. 

Таким образом, разностью точек а — (а~,Ь) и Р = (с, д) служит 
точка 

а— р —(а — с, Ь — д) (4) 

и эта разность однозначно определена. В частности, нулем будет 
служить начало координат (0, 0), а точкой, противоположной для 
точки а= (а, Ь), будет точка 

— а = (— а, — Ь). (5) 

Пусть, далее, даны точки а— (а, Ь) и Р = (с, д), причем точка р 
отлична от нуля, т. е. хотя бы одна из координат с, д не есть нуль 
и поэтому с 2 а! 2 0. Частным от деления аир должна быть 

такая точка (х, у), что (с, д) (х, у) = (а, Ь). Отсюда, ввиду (3), 

сх — ду - - а, 
дх + су = Ь. 
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Решая эту систему уравнений, мы получим: 

ас+,Ьй " Ьс — ай 
Х ~ с 2 + 3 2 ’ * ~~ с*+й 2 ‘ 


Таким образом, при |3^0 частное 
определено: 


а 

Т 


существует и однозначно 


а (ас-\-Ьй Ьс — ай\ 
У ~ Ѵс 2 + й* ’ с 2 + 3 2 ) 1 


Полагая здесь Р=а, мы получим, что единицей при нашем умно- 
жении точек служит точка (1, 0), лежащая на оси абсцисс на рас- 
стоянии 1 вправо от начала координат. Полагая, далее, в (6), что 
а=1=(1, 0), мы получим, что при (3 =^= 0 точкой, обратной для р, 
будет: 

■Р 1 ~ (с 2 + сі 2 ’ е 2 + 3 2 ) - ^ 


Таким образом, мы построили систему чисел, изображаемых 
точками плоскости, причем операции над этими числами опреде- 
ляются по формулам (2) и (3). Эта система чисел называется 
системой комплексных чисел. 

Покажем, что система комплексных чисел является расшире- 
нием системы действительных чисел. Для этой цели рассмотрим 
точки, лежащие на оси абсцисс, т. е. точки вида (а, 0); ставя 
в соответствие точке (а, 0) действительное число а, мы получаем, 
очевидно, взаимно однозначное соответствие между рассматривае- 
мым множеством точек и множеством всех действительных чисел. 
Применение к этим точкам формул (2) и (3) дает равенства 

(а, 0)+.(6, 0) = (а-|-^, 0), 

(а, 0)-(Ь, 0) = {аЬ, 0), 

т. е. точки (а, 0) складываются и перемножаются друг с другом 
так же, как соответствующие действительные числа. Таким образом, 
множество точек, лежащих на оси абсцисс, рассматриваемое 
как часть системы комплексных чисел, по своим алгебраическим 
свойствам ничем не отличается от системы действительных 
чисел, обычным способом изображенной точками прямой линии. 
Это позволяет нам не различать в будущем точку (а, 0) и действи- 
тельное число а, т. е. всегда полагать (а, 0) = а. В частности, 
нуль (0, 0) и единица (1, 0) системы комплексных чисел оказы- 
ваются обычными действительными числами 0 и 1. 

Нам нужно теперь показать, чтб среди комплексных чисел 
содержится корень уравнения (1), т. е. такое число, квадрат 
которого равен действительному числу — 1. Это будет, наиример, 
точка (0, 1), т. е. точка, лежащая на оси ординат на расстоянии 1 
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вверх от начала координат. Действительно, применяя (3), получаем: 

(О, 1).(0, 1) = (— 1, 0)— 1. 

Условимся обозначать эту точку буквой і, так что г' 2 = — 1. 

Покажем, наконец, что для построенных нами комплексных 
чисел может быть получена их обычная запись. Для этого най- 
дем сначала произведение действительного числа Ь на точку і: 

Ы = {Ь, 0) • (0, 1) = (0, ьу, 

это будет, следовательно, точка, лежащая на оси ординат и имею- 
щая ординату Ь, причем все точки оси ординат представимы в виде 
таких произведений. Если теперь (а, Ь) — произвольная точка, то 
ввиду равенства 

(а, Ь) = (а, 0) + (0, Ь) 

получаем: 

(а, Ь)—а-\-Ы, 

т. е. мы действительно приходим к обычной записи комплексных 
чисел; произведение и сумму в выражении а-\-Ы следует пони- 
мать, конечно, в смысле операций, определенных в построенной 
нами системе комплексных чисел. 

Теперь, когда комплексные числа нами уже построены, читатель 
без труда проверит, что все содержание предшествующих глав 
книги — и теория определителей, и теория систем линейных урав- 
нений, и теория линейной зависимости векторов, и теория опера- 
ций над матрицами — без всяких ограничений переносится на тот 
случай, когда к рассмотрению допускаются любые комплексные 
числа, а не только числа действительные. 

В заключение заметим, что проведенное нами построение системы 
комплексных чисел подсказывает следующий вопрос: нельзя ли так 
определить сложение и умножение точек трехмерного пространства, 
чтобы совокупность этих точек стала системой чисел, содержащей 
в себе систему комплексных чисел или хотя бы систему действи- 
тельных чисел? Этот вопрос выходит за рамки нашего курса, и мы 
лишь отметим, что ответ на него оказывается отрицательным. 

С другой стороны, замечая, что сложение комплексных чисел, 
определенное выше, по существу совпадает со сложением векторов 
на плоскости, выходящих из начала координат (см. следующий па- 
раграф), естественно поставить такой вопрос: можно ли при некото- 
рых п так определить умножение векторов в л-мерном действитель- 
ном векторном пространстве, чтобы по отношению к этому умноже- 
нию и обычному сложению векторов наше пространство оказалось 
числовой системой, содержащей в себе систему действительных 
чисел? Можно показать, что этого сделать нельзя, если требовать 
выполнения всех тех свойств операций, которые имеют место 
в системах рациональных, действительных и комплексных чисел. 
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Если же отказаться от коммутативности умножения, то такое по- 
строение возможно в четырехмерном пространстве; получающаяся 
система чисел называется системой кватернионов. Аналогичное 
построение возможно и в восьмимерном пространстве — получается 
так называемая система чисел Кэли. Здесь приходится отказы- 
ваться, впрочем, не только от коммутативности умножения, но и 
от его ассоциативности, заменяя последнее одним более слабым 
требованием. 

§ 18. Дальнейшее изучение комплексных чисел 

В соответствии с исторически сложившимися традициями мы 
будем называть комплексное число і мнимой единицей, а числа 
вида Ы — чисто мнимыми числами, хотя существование этих чи- 
сел не вызывает у нас сомнений и мы можем указать те точки пло- 
скости — точки оси ординат, — которыми эти числа изображаются. 
В записи комплексного числа а в виде а —а-\-Ы число а называется 
действительной частью числа а, а Ы — его мнимой частью. Пло- 
скость, точки которой отождествлены с комплексными числами по 
способу, изложенному в § 17, будет называться комплексной пло- 
скостью. Ось абсцисс этой плоскости называется действитель- 
ной осью, так как ее точки изображают действительные числа; 
соответственно ось ординат комплексной плоскости называется мни- 
мой осью. 

Сложение, умножение, вычитание и деление комплексных чисел, 
записанных в виде а-\-Ы, производятся следующим образом, как 
вытекает из формул (2), (4), (3) и (6) предшествующего параграфа: 

(а Ы) (с -)- сіі) = (а с) -\-(Ь -(- й) /; 

(а Ы) — (с + Л') = (а — с) + (Ь — й) і; 

(а + Ы) (с + сіі) = (ас — Ьй) + (ай Ьс) і; 
а-\-Ы _ ас + Ьй , Ьс — ай. 
с + йі ~ с 2 + й 2 'с 2 - \-й 2 *" 

Мы можем сказать, что при сложении комплексных чисел скла- 
дываются отдельно их действительные части и отдельно их 
мнимые части; аналогичное правило имеет место и для вычита- 
ния. Словесные выражения для формул умножения и деления были 
бы слишком громоздкими, и мы их не даем. Последнюю из этих 
формул нет необходимости запоминать; следует лишь помнить, 
что ее можно вывести, умножая числитель и знаменатель заданной 
дроби на число, отличающееся от 'знаменателя лишь знаком при 
мнимой части. 

Действительно, 

а Ы __ (а + Ы) (с — йі) _ (ас Ьй) + (Ьс — ай) і ас + Ьй , Ьс — ай . 

с-)-йі ~ (с-\-йі) (с— йі) ~~ с 2 -\-й 2 ~ ’ с 2 •+- й 2 ' с 2 -р А 2 * 
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Примеры. 

1) (2 + 50 + 0— 7/) = (2 + 1) + (5— 7) ( = 3—2/; 

2) (3 — 9/) — (7 + /) =(3 — 7) + ( — 9 — 1) / = — 4 — 1 0/; 

3) (1+2/) (3 — /) = [1-3 — 2-( — 1)] + [1 •( — 1) + 2-3] / = 5 + 5/; 

23 + / (23 + /) (3-/) _ 70-20/ _ 7 

’ 3 + / “ (3 +- /-5 (3 — /) ю 


Изображение комплексных чисел точками плоскости приводит 
к естественному желанию иметь геометрическое истолкование опе- 
раций, определенных для комплексных чисел. Для сложения такое 
истолкование может быть получено без затруднений. Пусть даны 
числа а — а-і-Ьі и р = с-+<//. Соединяем соответствующие им 
точки {а, Ь) и (с, сі) отрезками с началом координат и строим на 
этих отрезках, как на сторонах, параллелограмм (рис. 2). Четвер- 
той вершиной этого параллелограмма будет, очевидно, точка 


М 



М 


-а 




-ос 


а 




> 2 ^ 


Рис. 3. 


(а с, Ь 4- й). Таким .образом, сложение комплексных чисел гео- 
метрически выполняется по правилу параллелограмма, т, е. 
по правилу сложения векторов, выходят, их из начала координат. 

Далее, число, противоположное числу сс== 
= а + й/, будет точкой комплексной плоско- 
сти, симметричной с точкой а относительно 
начала координат (рис. 3). Отсюда без труда 
может быть получено геометрическое истолко- 
вание вычитания. 

Г еометрический смысл умножения и деления 
комплексных чисел станет ясным лишь после 
того, как мы введем для комплексных чисел 
новую запись, отличную от употреблявшейся 
нами до сих пор. Запись числа а в виде 
а — а Д- Ы использует декартовы координаты точки, соответствующей 
этому числу. Положение точки на плоскости вполне определяется, 
однако, также заданием ее полярных координат; расстояния г от начала 
координат до точки и угла ф между положительным направлением 
оси абсцисс и направлением из начала координат на эту точку 
(рис. 4). 


М 
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Число г является неотрицательным действительным числом, при- 
чем оно равно нулю лишь для точки 0. Для а, лежащего на дей- 
ствительной оси, т. е. являющегося действительным числом, число г 
будет абсолютной величиной а, поэтому и для любого комплексного 
числа а его иногда называют абсолютной величиной числа а; чаще, 
впрочем, число г называют модулем числа а. Обозначается оно 
через |а|. 

Угол ф будет называться аргументом числа а и обозна- 
чаться аг^а 1 ). Угол ф может принимать любые действительные 
значения, как положительные, так и отрицательные, причем поло- 
жительные углы должны отсчитываться против часовой стрелки, 
однако, если углы отличаются друг от друга на 2я или число, 
кратное 2л, то соответствующие им точки плоскости совпадают. 

Таким образом аргумент комплексного числа а имеет бесконечно 
много значений, отличающихся друг от друга на целые кратные 
числа 2л; из равенства двух комплексных чисел, заданных их мо- 
дулями и аргументами, можно лишь заключить, следовательно, что 
аргументы отличаются на целое кратной числа 2л, в то время как 
модули равны. Аргумент не определен лишь для числа 0; это число 
вполне определяется, однако, равенством |0| = 0. 

Аргумент комплексного числа является естественным обобще- 
нием знака действительного числа. В самом деле, аргумент поло- 
жительного действительного числа равен 0, аргумент отрицательного 
действительного числа равен л; на действительной оси из начала 
координат выходят лишь два направления и их можно различать 
двумя символами + и — , тогда как на комплексной плоскости 
направлений, выходящих из точки 0, бесконечно много и разли- 
чаются они уже углом, составляемым ими с положительным направ- 
лением действительной оси. 

Между декартовыми и полярными координатами точки суще- 
ствует следующая связь, справедливая при любом расположении 
точек на плоскости: 

а = гсо5ф, Ь — г зіп ф. (1) 

Отсюда 



Применим формулы (1) к произвольному комплексному числу 
а = а-\-Ы: 

а = а + Ы — г соз ф 4- (г зіп ф) /, 

или 

а = г (созф + і зіп ф). (3) 

Обратно, пусть число а = а-\-Ы допускает запись вида 
а — г 0 (созф 0 + гзігіф 0 ), где г 0 и ф 0 — некоторые действительные 

*) Мы отказываемся, следовательно, от обычных названий полярных 
координат точки — полярный радиус и полярный угол. 
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числа, причем г 0 5 * О, Тогда г 0 созф 0 = а, г 0 зіпф 0 = &, откуда 
г 0 = 4 . |/"а 2 + Ь 2 , т. е., ввиду (2), г 0 = |а |. Отсюда, используя (1), по- 
лучаем: со$ф 0 = со 5 ф, 5 іпф п = 5 Іпф, т. е. Ф 0 = аг§а. Таким образом, 
всякое комплексное число а однозначным образом записывается 
в виде ( 3 ), где г = |а|, ф = аг§а (причем аргумент ф определен, 
конечно, лишь с точностью до слагаемых, кратных 2л). Эта запись 
числа а называется его тригонометрической формой и будет 
дальше весьма часто использоваться. 


Числа 


0 / л ... п \ о 19 . . 19 

«=3 I соз -у-И зіп 1 , р = С 08 д- Я + ( 81 П 

Ѵ= Ѵ^З |соз^ +і зіп — 


заданы в тригонометрической форме; здесь |а|=чЗ, |В| = 1 , 1 ѵ ] — 3 ; 

я „19 я ( ч й я' 13 N 

аг§а=-^-, аг§р = -^-я, аг§у = — у- (или аг§ р = у , аге V = у я ) . 

С другой стороны, комплексные числа 

«' = (— 2) ^С05 ф-< $ІП-|^ , Р' = 3 ^С05 Я — / 8ІП я^ , 

, п ( я , . . 3 \ А-- 3 ,- 3 

у = 2 I С08 -у ф- I 31П — Я 1 , О = 81П — Я ф- I СОЗ -у я 


даны не в тригонометрической форме, хотя их записи напоминают запись (3). 
В тригонометрической форме эти числа записываются так: 


2 ( С05 


6 , • • 6 

-ц Я ф- ( 81П 


Я^ , Р'=3 ^ С05 у Яф-І $ІП-|- я^ , 


7 , . . 7 

= С05 ~Т Я+ I 81П -Г Я. 

4 4 


Разыскание тригонометрической формы числа у' наталкивается на труд- 
ность, почти всегда встречающуюся при переходе от обычной записи ком- 
плексного числа к тригонометрической и обратно: невозможно, кроме не- 
многих случаев, по заданным, числовым значениям синуса и косинуса найти 
точно угол, а для заданного угла написать точные значения его синуса 
и косинуса. 

Пусть комплексные числа аир заданы в тригонометрической 
форме: а = г (созф + і зіп ф), Р —г' (со$ф' ф-і зіпф'). Перемножим 
эти числа: 

ар = [г (С05 ф + / зіп ф)] • [г' (соз ф ' ф- / зіп ф')] = 

= гг' (соз ф СОЗ ф' -ф- І СОЗ ф ЗІП ф' -ф- І ЗІП ф СОЗ ф' — ЗІП ф ЗІП ф'), 


или 


ар = гг' [соз (ф ф- ф') ф- і зіп (ф ф- ф')]. 


( 4 ) 
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Мы получили запись произведения сф в тригонометрической форме, 
и поэтому |сф|=/т', или 

І«РН«|ІРІ, (5) 

т. е. модуль произведения комплексных чисел равен произведе- 
нию модулей сомножителей; далее, аід (оф) — ф + ф' или 

аіД(оф) = аг§а+аг§р, (6) 

т. е. аргумент произведения комплексных чисел равен сумме 
аргументов сомножителей 1 ). Эти правила распространяются, оче- 
видно, на любое конечное число множителей. В применении к случаю 
действительных чисел формула (5) дает известное свойство абсо- 
лютных величин этих чисел, а (6) превращается, как легко про- 
верить, в правило знаков при умножении действительных чисел. 

Аналогичные правила имеют место и для частного. Действи- 
тельно, пусть а=г (соз ф + і зіп ф), р — т' (соз ф' і зіп ф'), причем 
р=4=0, т. е. г* Ф 0. Тогда 

а г (соз ф + і зіп (р) г (соз (р 4 і зіп ф) (соз у' — і зіп ф') _ 

р ~ г' (соз ф' + і зіп ф') — г' (соз 2 ф' 4 зіп 2 ф') 

= -р- (СОЗ ф СОЗ ф' 4- І ЗІП ф соз ф' — І СОЗ ф ЗІП ф' 4- ЗІП ф ЗІП ф'), 


или 


= 7 [соз (ф - ф') 4- і зіп (ф - ф')]. 


Отсюда следует, что 


: — ИЛИ 
Г 


I О 1 

|р_| ’ 


(7) 


( 8 ) 


т. е. модуль частного двух комплексных чисел равен модулю 
делимого, деленному на модуль делителя; далее, аг§ ^ ^ — 
= ф — ф', или 

(9) 


а г і(|-) = аіда — аг§ р, 


т. е. аргумент частного двух комплексных чисел получается 
вычитанием аргумента делителя из аргумента делимого. 

Геометрический смысл умножения и деления выясняется теперь 
без затруднений. Действительно, ввиду формул (5) и (6), мы полу- 
чим точку, изображающую произведение числа а на число р = 
= г' (соз ф' ф і зіп ф'), если вектор, идущий от 0 к а (рис. 5), 
повернем против часовой стрелки на угол ф' = агдР, а затем 


х ) Подчеркнем, что равенство здесь понимается с точностью до слагае- 
мого, кратного 2л, 
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растянем этот вектор в г' = [Р| раз (при 0г^г'<;1 это будет, 
конечно, сжатием, а не растяжением). Далее, из (7) следует, что 
при а=г (созф + і зіп ф) Ф 0 будет 

а -1 — г" 1 [соз (— ф) + / зіп ( — ф)], (10) 


т. е. ] а -1 1 = | а [ -1 , агд(а _1 ) = — аг§а. Таким образом, мы получим 
точку а -1 , если от точки а перейдем к точке а', лежащей на рас- 
стоянии г -1 от нуля на той же полупрямой, выходящей из нуля, 




что и точка а (рис. 6) *), а затем перейдем к точке, симметричной 
с а' относительно действительной оси. 

Сумму и разность комплексных чисел, заданных в тригонометри- 
ческой форме, нельзя выразить формулами, подобными формулам (4) 
и (7). Для модуля суммы имеют место, однако, следующие важные 
неравенства: 

|а|-|РІ<|а + РІ<|«І + ІР|. (11) 

т. е. модуль суммы двух комплексных чисел меньше или равен 
сумме модулей слагаемых , но больше или равен разности этих 
модулей. Неравенства (11) вытекают из известной теоремы элемен- 
тарной геометрии о сторонах треугольника ввиду того, что |а + Р| 
равен, как мы знаем, диагонали параллелограмма со сторонами 
( оі| и |Р|. Специального рассмотрения, которое мы предоставляем 
читателю, требует, впрочем, случай, когда точки а, р и 0 лежат 


х ) Тогда и только тогда |а'| = (о|, если |а| = 1, т. е. если точка а 
лежит на окружности единичного круга. Если а лежит внутри единичного 
круга, то а' будет вне его, и обратно, причем этим путем мы получаем, 
очевидно, взаимно однозначное соответствие между всеми точками ком- 
плексной плоскости, лежащими вне единичного круга, и всеми точками, 
лежащими внутри этого круга и отличными от нуля. 
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на одной прямой; лишь в этом случае в формулах (11) могут 
достигаться равенства. 

Из (11), ввиду а — р = а-(-( — р) и 

І-РІНРІ (12) 

(это равенство следует хотя бы из геометрического толкования 
числа — р), вытекают также неравенства 

|а|-|РІ<І*-РІ<|«І+ІРІ. (13) 

т. е. для модуля разности имеют место такие же неравенства, как 
и для модуля суммы. 

Неравенства (11) можно было бы получить также следующим путем. 
Пусть а = г (соз ф + г зіп <р), р =г' (соз ф' +і зіп ф') и пусть тригонометри- 
ческая форма числа а + Р есть а + р = /? (созф + і зіпф). Складывая отдельно 
действительные и отдельно мнимые части, получаем: 

Г СОЗ ф -)- г' СОЗ ф' = Ц'С 03 ф, 
г зіп ф + г' зіп ф ' = Я зіп ф; 

умножая обе части первого равенства на созф, обе части второго — на зіп ф 
и складывая, получаем: 

г (соз ф соз ф + зіп ф зіп ф) + г' (соз ф' соз ф + зіп ф' зіп ф) = Я (соз 2 ф + зіп 2 ф), 
т. е. 

г соз (ф— ф) + г' СОЗ (ф' — ф) = /?. 

Отсюда, так как косинус никогда не бывает больше единицы, следует нера- 
венство г + г'Зз/?, т. е. |а| + | р |5=|а+р|. С другой стороны, а=(а+Р)— 
— Р = (а + Р)+( — Р)- Отсюда, по доказанному и в силу (12), 

|аК[а + Р|+| — РІ = |а + РІ + |Рі, 

откуда | о | — | р | < | а + р |. 

Следует заметить, что для комплексных чисел понятия «больше» 
и «меньше» не могут быть разумно определены, так как эти числа, 
в отличие от действительных чисел, располагаются не на прямой 
линии, точки которой естественным образом упорядочены, а на 
плоскости. Поэтому сами комплексные числа (а не их 
модули) никогда нельзя соединять знаком нера- 
венства. 

Сопряженные числа. Пусть дано комплексное число а = а-\-Ы. 
Число а — Ы , отличающееся от а лишь знаком при мнимой части, 
называется числом, сопряженным с а, и обозначается а. 

Напомним, что при рассмотрении деления комплексных чисел мы 
прибегали к сопряженным числам, хотя и не вводили этого названия. 

Числом, сопряженным с а, будет, очевидно, а, т. е. можно 
говорить о паре сопряженных чисел. Действительные числа, и только 
они, сопряжены сами себе. 
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Геометрически сопряженные числа являются точками, симметрич- 
ными относительно действительной оси (рис. 7). Отсюда следуют 
равенства 

|а| = |а(, аг§а= — аг§а. (14) 


Сумма и произведение сопряженных комплексных 
являются действительными числами. В самом деле, 


а+а=2а, \ 

аа— а 2 + й 2 =|а| 2 . / 


чисел 


(15) 


Последнее равенство показывает, что число а а даже положи- 
тельно при афО. В § 24 будет получена теорема, показывающая, 


М 



что доказанное сейчас свойство сопряженных 
чисел является для них характерным. 
Равенство 

(а — Ы) 4- (с — сН) = (а с) — ( Ь -}- й) і 

показывает, что число, сопряженное с суммой, 
двух чисел, равно сумме чисел, сопряжен- 
ных со слагаемыми: 

(16) 


ос 4~ Р =я 4~ р. 
Аналогично, из равенства 

(а — Ы) (с — йі) = (ас — Ьд) - 


■ (ад 4- Ьс) і 


вытекает, что число, сопряженное с произведением, равно про- 
изведению чисел, сопряженных с сомножителями: 

оф=а.р. (17) 

Непосредственная проверка показывает также справедливость формул 


а— р = а— р, 

(18) 

(т)~Г 

(19) 


Докажем следующее утверждение: если число а некоторым 
образом выражено через комплексные числа р х , р 2 , ..., р п при 
помощи сложения, умножения, вычитания и деления, то, заменяя 
в этом выражении все числа р А их сопряженными, мы получим 
число, сопряженное с а; в частности, если число а действительное, 
то оно не меняется при замене всех комплексных чисел р л их со- 
пряженными. 

Будем доказывать это утверждение индукцией по п, так как 
при п~ 2 оно вытекает из формул (16) — (19). 

Пусть число а выражено через числа р х , р 2 , ..., Р„, не обяза- 
тельно различные. В этом выражении указан определенный порядок, 
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в котором применяются операции сложения, умножения, вычитания 
и деления. Последним шагом будет применение одной из этих 
операций к числу ■у 1 , выраженному через числа (3*, р 2 , .,,, (З л , где 
І^й^л — 1, и к числу у 2 , выраженному через числа Р А+1 , .... р„. 
По индуктивному предположению замена чисел (3*, (3 2 , |3 Й 

на сопряженные влечет за собой замену числа у г на у 1 , а заме- 
на чисел |3* +1 , |3* + 2 , Р„ на сопряженные заменяет у 2 на у 2 . 

Однако по одной из формул (16) — (19) переход от у х и у 2 к у х 
и у 2 превращает число а в а. 


§ 19. Извлечение корня из комплексных чисел 

Переходим к вопросу о возведении комплексных чисел в степень 
и извлечении из них корня. Для возведения числа а=а-\-Ы 
в целую положительную степень п достаточно применить К выраже- 
нию [а-\-Ы) п формулу бинома Ньютона (эта формула справедлива 
и для комплексных чисел, так как ее доказательство основано лишь 
на законе дистрибутивности), а затем воспользоваться равенствами 


і 2 — — 1, і 3 — — і, 
і ік = 1 , 


= 1, откуда вообще 
і ік+1 = і, і‘*+ г = — 1, 


Д*+ 3 = _, 


Если число а задано в тригонометрической форме, то при целом 
положительном л из формулы (4) предшествующего параграфа 
вытекает следующая формула, называемая формулой. Муавра: 

[г (СОЗф + І 5ІП ф)] л =г" (соз Лф + і 5ІП Лф), (1) 

т. е. при возведении комплексного числа в степень модуль возво- 
дится в эту степень, а аргумент умножается на показатель 
степени. Формула (1) верна и для целых отрицательных показателей. 
Действительно, ввиду а.~ п — , достаточно применить формулу 

Муавра к числу сс -1 , тригонометрическую форму которого дает 
формула (10) предшествующего параграфа. 


Примеры. 

1 )* 37 = і, г 122 = — 1; 

2) (2 + 5 г) 3 = 2 3 + 3 -2 2 -Ы + 3 • 2 • 5 + 5 3 Р = 

= 8+60( — 150— 125і = — 142— 65і; 


3) 

4) 


^1^2 ^со5^-+г'8іп-^-^ =(Ѵ Г 2) 4 (С05Я + 18ІПЯ)==— 4; 

[з(со*Х + г ‘ 8 і П т)] 3 = 

■=3 _3 |^со5 ^ — -|-я ^ зіп Т Я )] = 57 ^ с08 '§' ІХ + ‘ • 
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Частный случай формулы Муавра, а именно равенство 

(СОЗ ф І ЗІП ф)" = СОЗ /2ф І 5ІП Лф, 

позволяет легко получить формулы для синуса и косинуса кратного 
угла. Действительно, раскрывая левую часть этого равенства по 
формуле бинома и приравнивая отдельно действительные и мнимые 
части обеих частей равенства, мы получим: 


С05Яф=С0з"ф — ^ С05 П_2 ф-5ІП 2 ф-1- ^ СОз" “ 4 ф ■ 5ІП 4 ф — . . ., 

8ІПЯф = ^ С05 П-1 ф-ЗІПф — ^ СОЗ П — 3 ф • ЗІП 3 ф 

+ 'І соз" -5 • зіп 5 ф — . , 

здесь ^ есть обычное обозначение биномиального коэффициента: 
( п \_ п (п— 1)(я — 2 )...(л — й + 1) 

и;- і-2-з . ..к ■ • 

При п = 2 мы приходим к известным формулам 
соз 2ф = соз 2 ф — зіп 2 ф, 
зіп 2ф = 2 соз ф зіп ф, 
а при л = 3 — к формулам 

соз Зф — С03 8 ф — 3 соз ф зіп 2 ф, 
зіп Зф = 3 соз 2 ф зіп ф — 8ІП 3 ф. 


Извлечение корня из комплексных чисел представляет уже много 
больше трудностей. Начнем с извлечения квадратного корня из 
числа а = а-уЫ. Мы не знаем пока, существует ли такое ком- 
плексное число, квадрат которого равен а. Предположим, что такое 
число и + гя существует, т. е., употребляя обычную символику, 
можно написать 

У" а -|- Ы = и + ѵі. 


Из равенства 
следует 


(ц+гл) 2 — а-\-Ы 

и 2 — ѵ 2 =а, 1 
2 иѵ—Ь. / 


( 2 ) 


Возводя в квадрат обе части каждого из равенств (2), а затем скла- 
дывая их, получаем: 

(« 2 — г/ 2 ) 2 + 4«Ѵ ! = (и 2 + ѵ г ) 2 —а 2 + Ь 2 , 


и 2 -\-ѵ 2 = + V а 2 


откуда 
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положительный знак взят потому, что числа и и» действительные, 
и поэтому левая часть равенства положительная. Из этого равенства 
и из первого из равенств (2) получаем: 

и 2 = ^ (а + ]/а 2 +& 3 ), 

= у (— а + У а 2 + Ь 2 ). 

Мы приходим, извлекая квадратные корни, к двум- значениям для и, 
отличающимся друг от друга знаком, а также к двум значениям 
для ѵ. Все эти значения будут действительными, так как квадрат- 
ные корни будут извлекаться при любых а и Ь из положительных 
чисел. Полученные значения для к ив нельзя комбинировать между 
собой произвольным образом, так как, ввиду второго из равенств (2), 
знак произведения иѵ должен совпадать со знаком Ь. Это дает две 
возможные комбинации значений и и ѵ, т. е. два числа видаи + гч, 
которые могут служить значениями квадратного корня из числа а; 
эти числа отличаются друг от друга знаком. Элементарная, хотя и 
громоздкая, проверка (возведением полученных чисел в квадрат, 
отдельно для случая 0 и для случая 6 < 0 ) показывает, что 
найденные нами числа действительно являются значениями квадрат- 
ного корня из числа а. Таким образом, извлечение квадратного 
корня из комплексного числа всегда возможно и дает два значе- 
ния, отличающиеся друг от друга знаком , 

В частности, теперь делается возможным извлечение квадратного 
корня и из отрицательного действительного числа, причем значения 
этого корня будут чисто мнимыми. В самом деле, если а<С. О и 
Ь—0, то У а г + Ь г = — а , так как этот корень должен быть поло- 
жительным, а тогда и 2 = -^-(а — а) = 0 , т. е. и — 0 , откуда 
у а = ± ѵі. 

Пример. Пусть а — 21 — 20/. Тогда /а 2 -]-& 2 = /441 + 400 = 29. 

Поэтому ы 2 = і(21 +29) = 25, о 2 =-|- (— 21 29) = 4, откуда « = ±5, 

н=±2. Знаки и и ѵ должны быть различными ввиду отрицательности Ь, 
поэтому 

/21— 20/= ± (5— 2і). 

Попытки извлечения из комплексных чисел, заданных в виде 
а-\-Ы, корней более высокой степени, чем вторая, встречаются 
с непреодолимыми затруднениями. Так, если бы мы захотели таким же 
методом, как выше, извлечь из числа ауы кубичный, корень, 
то должны были бы решить некоторое вспомогательное кубичное 
уравнение, чего мы пока не умеем и что в свою очередь требует, 
как мы узнаем в § 38, извлечения кубичного корня из комплексного 
числа. С другой стороны, тригонометрическая форма весьма хорошо 
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приспособлена для извлечения корней любой степени и, пользуясь 
ею, мы сейчас полностью исчерпаем этот вопрос. 

Пусть нужно извлечь корень я-й степени из числа а=г(созф-{-&5Іпф). 
Предположим, что это сделать можно и что в результате получается 
число р (созѲ + / зіп Ѳ), т. е. 

[р (СОЗ Ѳ + І ЗІП Ѳ)]” = Г (соз ф + / ЗІП ф). (3) 

Тогда, по формуле Муавра, р п = г, т. е. р = у/ г , где в правой 
части стоит однозначно определенное положительное значение корня 
я-й степени из положительного действительного числа г. С другой 
стороны, аргумент левой части равенства (3) есть яѲ. Нельзя утвер- 
ждать, однако, что яѲ равно ф, так как эти углы могут в действи- 
тельности отличаться на слагаемое, являющееся некоторым целым 
кратным числа 2я. Поэтому лѲ=ф-)-2&л, где к — целое число, 
откуда 

д ф + 2кп 

п 

^ , , л/- ( Ф4-2 кп , . . ср + 2 кл\ 

Обратно, если мы оерем число у г і соз - д - -]- 1 зіп — ) , 

то при любом целом к , положительном или отрица- 
тельном, л-я степень этого числа равна а. Таким образом, 

\/ г (соз ф + і зіп ф) = у/ г ^ соз _)_ і зіп — ^ . (4) 


Давая к различные значения, мы не всегда будем получать раз- 
личные значения искомого корня. Действительно, при 

кг= 0, 1, 2, ..., я— 1 (5) 


мы получим л значений корня, которые все будут различными, 
так как увеличение к на единицу влечет за собой увеличение аргу- 
2л, 

мента на — . Пусть теперь к произвольно. Если к = пд-{-г, 
Ое^гСл — 1, то 


Ф + 2йя_ ф + 2 (лф + г)я 
п п 


Ф + 2гя 
п 




т. е. значение аргумента при нашем к отличается от значения аргу- 
мента при к~г на число, кратное 2л; мы получаем, следовательно, 
такое же значение корня, как при значении к, равном г, т. е. 
входящем в систему (5). 

Таким образом, извлечение корня п-й степени из комплекс- 
ного числа а всегда возможно и дает п различных значений. 
Все значения корня п-й степени расположены на окружности 
радиуса \/\а\ с центром в нуле и делят эту окружность на п 
равных частей. 
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В частности, корень я-й степени из действительного числа а 
также имеет л различных значений; действительных среди этих 
значений будет два, одно или ни одного в зависимости от знака а 
н четности л. 


Пример ы. 

1) Р = У : 


3 3 \ - 

2 ( соз-^-я + г зіп -^-я | = у / 5 


2 \ соз 


-^-я-{-26я 


3 

я 


+ і зіп 


— я + 2йя'\ 




6 = 0: р 0 =^/2 ^ соз -^- + / зіп ^ 

6 = 1: = (соз^я + гзіп^я^ ; 

6 = 2: р 2 = у 2 [соз||я + ізіп||я'\ . 


2 ) 


Р = У і = У соз ~ + і зіп ~ = 


тр + 26 я -^- + 26 л 

соз тг И зіп н ; 


„ я,., л Ѵ2 , . Ѵ2 а 5 ,..5 

Ро = соз^- + < Зіп — = — ^ — }- 1 — ; р х = соз -^-я + ізіп— я = — р 0 . 


+ 26я , . . я + 26я\ 
1 г зіп — Ц ' 


3) р= у/— 8= 8 (соз я + і зіп л) = 2 ^соз^-™^ + 

Ро = 2 ^соз^- + гзіп~^ = 1+і УТ ; 
р х = 2 (соз я + / зіп я) = — 2; 
р 2 = 2 ^соз^ +г зіп ^ = 1 — і Уз. 




Корни из единицы. Особенно важен случай извлечения корня 
л-й степени из числа 1. Этот корень имеет л значений, причем, 
ввиду равенства 1 = соз 0 Д- і зіп 0 и формулы (4), все эти значения 
или, как мы будем говорить, все корни п-й степени из единицы, 
даются формулой 


у\ 


26л , . . 26я 

соз 1 зіп — ; 

п ' п 


6 = 0, 1, 


( 6 ) 


Действительные значения корня л-й степени из единицы получаются 
из формулы (6) при значениях 6 = 0 и -^ , если л четно, и при 

6 = 0, если л нечетно. На комплексной плоскости корни л-й степени 
из единицы расположены на окружности единичного круга и делят 
ее на л равных дуг; одной из точек деления служит число 1. 
Отсюда следует, что те из корней л-й степени из единицы, которые 
не являются действительными, расположены симметрично относи- 
тельно действительной оси, т. е. попарно сопряжены. 
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Квадратный корень из единицы имеет два значения: 1 и — 1, 
корень четвертой степени из единицы — четыре значения: 1, — 1, 
і и — і. Для дальнейшего полезно запомнить значения кубичного 

корня из единицы. Это будут, ввиду (6), числа соз-у- + г зіп— , 

где к = 0, 1, 2, т. е., кроме самой единицы, также сопряженные 
между собою числа 

7л ... 2л 1 . . Ѵ^З 
е 1 = соз-у + г 8іп-д-= — +і — , 

4я , . . 4я 1 . 

е 2 = соз-д- зш-д- = — у — і -у . 

Все значения корня п-й степени из комплексного числа а 
можно получить умножением одного из этих значений на все 
корни п-й степени из единицы. Действительно, пусть р будет 
одно из значений корня п- й степени из числа а, т. е. Р” = а, 
а е — произвольное значение корня л-й степени из единицы, т. е. 
е"=1. Тогда фе)" = р п е" = а, т. е. ре также будет' одним из значе- 
ний для %/а. Умножая р на каждый из корней л-й степени из 
единицы, мы получаем л различных значений корня л-й степени из 
числа а, т. е. все значения этого корня. 

Примеры. 1) Одно из значений кубичного корня из — 8 есть —2 
Два других будут, ввиду (7), числа 2е х = 1 — г У 3~ и — 2е 2 = 1-Т* V 3 
(см. выше пример 3)). 

2) ^/81 имеет четыре значения: 3, — 3, Зі, — 3*. 

Произведение двух корней п-й степени из единицы само есть 
корень п-й степени из единицы. Действительно, если г п = 1 и >)"=1, 
то (етр" = е п т)" = 1 . Далее, число, обратное корню п-й степени из 
единицы, ' само есть такой же корень. В самом деле, пусть е" = 1. 
Тогда из е-е _1 = 1 следует е п -(е -1 ) п = 1 , т. е. (е _1 )" = 1 . Вообще, 
всякая степень корня п-й степени из единицы есть также корень 
п-й степени из единицы.. 

Всякий корень к - й степени из единицы будет также корнем /-Й 
степени из единицы для всякого /, кратного к. Отсюда следует, что 
если мы будем рассматривать всю совокупность корней л-й степени 
из единицы, то некоторые из этих корней уже будут корнями л'-й 
степени из единицы для некоторых л', являющихся делителями числа л. 
Для всякого л существуют, однако, такие корни л-й степени из еди- 
ницы, которые не являются корнями из единицы никакой меньшей 
степени. Такие корни называются первообразными корнями л-й сте- 
пени из единицы. Их существование вытекает из формулы (6): если 
значение корня, соответствующее данному значению мы обозначим 
через е А (так что ё 0 = 1), то на основании формулы Муавра (1) 
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Никакая степень числа е 1 , меньшая, чем п- я, не будет, следовательно, 
равна 1, т. е. е х = со$^ + і зіп — является первообразным корнем. 

Корень п-й степени из единицы г тогда и только тогда будет 
первообразным, если его степени в к , к = 0, 1, . .., п — 1, раз- 
личны, т. е. если ими исчерпываются все корни п-й степени 
из единицы. 

Действительно, если все указанные степени числа е различны, то 
е будет, очевидно, первообразным корнем п- й степени. Если же, 
например, в к = г 1 при 0 ^к<СІ^п — 1, то г 1 ~ к ~\, т. е., ввиду 
неравенств 1=</ — к^п — 1, корень е не будет первообразным. 

Число е 1 , найденное выше, в общем случае — не единственный 
первообразный корень п- й степени. Для разыскания всех этих корней 
служит следующая теорема. 

Если е есть первообразный корень п-й степени из единицы, 
то число е* тогда и только тогда будет первообразным корнем 
п-й степени, если к взаимно просто с п. 

В самом деле, пусть й будет наибольшим общим делителем чисел 
кип. Если йу> 1 и к = йк', п = йп', то 

(е*)"' = е*"' = в к ' п = ( г п ) к ‘ ==Т, 

т. е. корень е* оказался корнем п' - й степени из единицы. 

Пусть, с другой стороны, й~ 1 и пусть, вместе с тем, число е к 
оказывается корнем /п-й степени из единицы, 1^/м<л. Таким 
образом 

(е к ) т — - г кт = 1 . 

Так как число е — первообразный корень п- й степени из еди- 
ницы, т. е. лишь его степени с показателями, кратными п, могут 
быть равными единице, то число кт будет кратным п. Отсюда вы- 
текает, однако, так как 1 ^т<С.п, что числа к и п не могут быть 
взаимно простыми в противоречие с предположением. 

Таким образом, число первообразных корней п- й степени из еди- 
ницы равно числу целых положительных чисел к, меньших п и 
взаимно простых с ним. Выражение для этого числа, обычно обо- 
значаемого через ф(я), можно найти в любом курсе теории чисел. 

Если р-— простое число, то первообразными корнями р- й степени 
из единицы будут все эти корни, кроме самой единицы. С другой 
стороны, среди корней четвертой степени из единицы первообразными 
будут / и — і, но не 1 и — 1. 



ГЛАВА ПЯТАЯ 

МНОГОЧЛЕНЫ И ИХ КОРНИ 

§ 20. Операции над многочленами 

Содержание первых двух глав книги, а именно — теория определи- 
телей и теория систем линейных уравнений, возникло в качестве 
непосредственного развития того направления в школьном курсе 
алгебры, которое, начинаясь от одного уравнения первой степени 
с одним неизвестным, вело к системам двух и трех уравнений первой 
степени с двумя и, соответственно, тремя неизвестными. Другое на- 
правление в элементарной алгебре, воспринимавшееся там как еще 
более значительное, состояло в переходе от уравнения первой степени 
с одним неизвестным к произвольному квадратному уравнению снова 
с одним неизвестным, а затем и к некоторым частным типам уравнений 
третьей и четвертой степени. Это направление вырастает в весьма 
большой и содержательный раздел высшей алгебры, посвященный 
изучению произвольных уравнений любой п - й степени с одним неиз- 
вестным. К этому разделу алгебры, исторически самому " раннему, 
относятся как настоящая глава, так и некоторые из дальнейших 
глав книги. 

Общий вид уравнения п - й степени (где п — некоторое целое поло- 
жительное число) есть 

аоХ п а 1 х п ~ 1 а п _ 1 х-{- а п = 0. (1) 

Коэффициенты а 0 , а г , ..., а п _ 1 , а п этого уравнения мы будем счи- 
тать произвольными комплексными числами, причем старший коэф- 
фициент а 0 должен быть отличным от нуля. 

Если написано уравнение (1), то всегда предполагается, что тре- 
буется его решить. Иными словами, требуется найти такие число- 
вые значения для неизвестного х, которые удовлетворяют этому 
уравнению, т. е. после подстановки вместо неизвестного и выполне- 
ния всех указанных операций обращают левую часть уравнения (1) 
а нуль. 

Целесообразно, однако, заменить задачу решения уравнения (1) 
более общей задачей изучения левой части этого уравнения 

а оХ п + а 1 х п ~ 1 а п _ 1 х + а п , 


( 2 ) 
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называемой многочленом (или полиномом) п-й степени от неиз- 
вестного х. Мы выбираем первый из этих терминов; следует твердо 
помнить, что теперь многочленом называется лишь выражение вида (2), 
т. е. лишь сумма целых неотрицательных степеней неизвестного х, 
взятых с некоторыми числовыми коэффициентами, а не любая сумма 
одночленов, как это было в элементарной алгебре. В частности, мы 
не будем считать многочленами такие выражения, которые содержат 
неизвестное х с отрицательными или дробными показателями, напри- 
мер, 2х г — ^-+3, или ах~ 3 -\-Ьх~' 1 -\-сх~ 1 -{-ал Г ех^ Г /х 2 , или же 
1 

а: 2 4-1. Для сокращенной записи многочленов будут употребляться 
символы /(я), §{х), ер (я) и т. д. 

Два многочлена /(х) и %(х) будут считаться равными ( шт то- 
ждественно равными), / {х) = § (х), в том случае, если равны их 
коэффициенты при одинаковых степенях неизвестного. В частности, 
никакой многочлен, хотя бы один коэффициент которого отличен от 
нуля, не может быть равным нулю, и поэтому знак равенства, упо- 
требляемый в записи уравнения л-й степени (1), не имеет никакого 
отношения к определенному сейчас равенству многочленов. Знак =, 
связывающий многочлены, следует в дальнейшем всегда понима'ть 
в смысле тождественного равенства этих многочленов. 

Таким образом, на многочлен л-й степени (2) следует смотреть 
как на некоторое формальное выражение, вполне определяемое набо- 
ром своих коэффициентов а 0 , а ѵ ...,а п , где а 0 ф 0. Точный смысл 
этих слов будет выяснен много позже, в гл. 10. Заметим, что, по- 
мимо записи многочлена в виде (2), т. е. по убывающим сте- 
пеням неизвестногол:, будут допускаться и другие его записи, 
получающиеся из (2) перестановкой слагаемых, например, запись, п о 
возрастающим степеням неизвестного. 

Конечно, на многочлен (2) можно было бы смотреть и с точки 
зрения математического анализа, т. е. считать его комплексной функ- 
цией комплексного переменного лг. Следует учесть, однако, что две 
функции считаются равными в том случае, если 
равны их значения при всех значениях переменногол:. 
Ясно, что два многочлена, равные в указанном выше формально- 
алгебраическом смысле, будут равны и как функции от х. Обратное 
будет доказано, однако, лишь в § 24. После этого алгебраическая 
и теоретико-функциональная точки зрения на понятие многочлена 
с числовыми коэффициентами на самом деле станут равносильными, 
пока же мы должны каждый раз указывать, какой именно смысл 
придается понятию многочлена. В настоящем и двух следующих 
параграфах мы будем смотреть на многочлен как на формально-ал- 
гебраическое выражение. 

Существуют, понятно, многочлены л-й степени для любого нату- 
рального числа п. Рассматривая всевозможные такие многочлены, 
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мы, помимо многочленов первой степени, квадратных, кубичных и 
т. д., встретимся и с многочленами нулевой степени , т. е. 
с отличными от нуля комплексными числами. Число нуль также 
будет считаться многочленом; это будет единственный многочлен, 
степень которого не определена. 

Сейчас мы определим для многочленов с комплексными коэффи- 
циентами операции сложения и умножения. Эти операции будут вве- 
дены по образцу операций над многочленами с действительными 
коэффициентами, известных читателю из курса элементарной алгебры. 

Если даны многочлены /( х ) и ^(д;) с комплексными коэффициен- 
тами, записанные для удобства по возрастающим степеням х\ 

/(х) = а 0 + а 1 х + ...+а п ^ 1 х п ~ 1 +а п х п , а п Ф О, 
§(х)^=Ь 0 -\-Ь 1 хф ... +Ъ !і - Х х 5 - 1 + Ь !1 х $ , Ь,Ф О, 

и если, например, п^з, то их суммой называется многочлен 
/(х)+ё(х)=^с 0 + с 1 хф . . . +с п _ 1 х?- 1 + с п х' 1 , 

коэффициенты которого получаются сложением коэффициентов много- 
членов /(х) и §{х), стоящих при одинаковых степенях неизвест- 
ного, т. е. 

с, • = ; = 0, 1, ..., п, (3) 

причем при п >5 коэффициенты Ь і+1 , Ь 3+2 , . .., Ь п следует считать 
равными нулю. Степень суммы будет равна п, если п больше х, но 
при п = з она может случайно оказаться меньше п , а именно в слу- 
чае Ъ п = а п . 

Произведением многочленов /(х) и §(х) называется многочлен 

/(х)- ё (х)=а 0 + а 1 л :+ . . . + а п+ ,_ 1 х п +*- 1 +а п+! х" + *, 

коэффициенты которого определяются следующим образом: 

йі= 2 а к Ь и * = °. •••. пфз— 1, п-\-з, (4) 

к+1=1 

т. е. коэффициент есть результат перемножения таких коэффи- 
циентов многочленов /(х) и §(х), сумма индексов которых равна і, 
и сложения всех таких произведений; в частности, сі 0 = аоІ>о , й у = 
— а 0 Ь 1 ф а^о, ..., й п+5 =а п Ь 3 . Из последнего равенства вытекает 
неравенство Ф 0 и поэтому степень произведения двух много- 
членов равна сумме степеней этих многочленов. 

Отсюда следует, что произведение многочленов , отличных от 
нуля, никогда не будет равным нулю. 

Какими свойствами обладают введенные нами операции для много- 
членов? Коммутативность и ассоциативность сложе- 
ния немедленно вытекают из справедливости этих свойств для сло- 
жения чисел, так как складываются коэффициенты при каждой 
степени неизвестного отдельно. Вычитание оказывается выполни- 
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мым: роль нуля играет число нуль, включенное нами в число много- 
членов, а противоположным для записанного выше много- 
члена /(лг) будет многочлен 

—/(х)=—а 0 —а 1 х — ... —а п _ 1 х’ г ~ 1 — а п х п . 

Коммутативность умножения вытекает из коммутатив- 
ности умножения чисел и того факта, что в определении произведения 
многочленов коэффициенты обоих множителей /(х) и §(х) исполь- 
зуются совершенно равноправным образом. Ассоциативность 
умножения доказывается следующим образом: если, помимо запи- 
санных выше многочленов /(х) и &(х), дан еще многочлен 

к (х) — со+ с г х+ ... +с і _ 1 х і ~ 1 + с 1 х і , с і Ф 0, 

то коэффициентом при х 1 , і — 0, 1, ..., л + $-М в произведении 
[/{х) §{х)]к{х) будет служить число 

2 ( 2 а *М с «= 2 а Ь Ь 1 С т, 

І+т = і \к + 1=І } к + І + т=і 

а в произведении /(х)[§{х)к(х)\ — равное ему число 

2 а к( 2 Ь 1 С Л = 2 а к Ь 1 С т- 

к +і=1 \І+т=1 ) к + І+т=і 

Наконец, справедливость закона дистрибутивности 
вытекает из равенства 

2 2 а ь с і+ 2 Ѵо 

к + 1 = І к+1=і к+1=1 

так как левая часть этого равенства является коэффициентом при х 1 
в многочлене [ у (лг) -}- ^ (л:)1 /г (лт), а правая часть — коэффициентом 
при той же степени неизвестного в многочлене /(х) к(х)-\- @(х) к (х). 

Заметим, что роль единицы при умножении многочленов играет 
число 1, рассматриваемое как многочлен нулевой степени. С другой 
стороны, многочлен /(х) тогда и только тогда обладает обрат- 
ным многочленом / _1 (лг), 

?{х)ГЦх) = \, (5) 

если /(. х ) является многочленом нулевой степени. Действительно, 
если /(х) является отличным от нуля числом а, то обратным много- 
членом служителя него число а -1 . Если же /(х) имеет степень 
л^І, то степень левой части равенства (5), если бы многочлен 
/ -1 (лг) существовал, была бы не меньше л, в то время как справа 
стоит многочлен нулевой степени. 

Отсюда вытекает, что для умножения многочленов обратная 
операция — деление — не существует. В этом отношении система 
всех многочленов с комплексными коэффициентами напоминает си- 
стему всех целых чисел. Эта аналогия проявляется и в том, что для 



134 


МНОГОЧЛЕНЫ И ИХ КОРНИ 


[гл. 5 


многочленов, как и для целых чисел, существует алгоритм деле- 
ния с остатком. Этот алгоритм для случая многочленов с дей- 
ствительными коэффициентами известен читателю еще из элементар- 
ной алгебры. Так как, однако, мы рассматриваем теперь случай 
многочленов с комплексными коэффициентами, следует еще раз дать 
все относящиеся сюда формулировки и привести доказательства. 

Для любых двух многочленов /(х) и у (х) можно найти такие 
многочлены д (х) иг (х), что 

/(х) = ё{х)д{х) + г(х), (6) 

причем степень г (х) меньше степени $(х) или же г(Х)~ 0. 
Многочлены д (х) и г(х), удовлетворяющие этому условию, опре- 
деляются однозначно. 

Докажем сперва вторую половину теоремы. Пусть существуют 
еще многочлены д (х) и г(х), также удовлетворяющие равенству 
/{х)=§(х)'д(х)+7(х), (7) 

причем степень г(х) снова меньше степени Приравнивая 

друг другу правые части равенств (6) и (7), получим: 

ё{х)[д(х)—д(х)]=7(х) — г(х). 

Степень правой части этогоравенства меньше степени § (л:), степень же 
левой части была бы при д(х) — ~д(х)Ф 0 больше или равна сте- 
пени §{х). Поэтому должно быть д(х) — ~д(х) — 0, т. е. д (х) = д (х), 
а тогда и г(х) — г(х), что и требовалось доказать. 

Переходим к доказательству первой половины теоремы. Пусть 
многочлены /(х) и §(х) имеют соответственно степени п и 5. Если 
п<б .$ , то можно положить д(х) = 0, г(х)=/(х). Если же п^з, 
то воспользуемся тем же методом, каким в элементарной алгебре 
производилось деление многочленов с действительными коэффициен- 
тами, расположенных по убывающим степеням неизвестного. Пусть 

/(х) = а 0 х п + а 1 х п - 1 + ... +а п _ 1 х + а т а 0 ф 0, 

^(л:) = г>о-К' ? +6і* 5-1 + ... +Ь 5 _ 1 х-\-Ь 5 , Ъ 0 фО. 

Полагая 

Пх)~^х п -* ё (х) = / 1 {х), (8) 

°0 

мы получим многочлен, степень .которого меньше п. Обозначим эту 
степень через л 1 , а старший коэффициент многочлена / г (х) — через а 10 . 
Положим, далее, если все еще п 1 ^з, 

/і(х)— ^ х^-*8(х)=/ г (х), ( 8 і ) 

°0 


х ) Или же г(х) — 0. В дальнейшем этот случай не будет оговариваться. 
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обозначим через и 2 — степень, а через а 20 — старший коэффициент 
многочлена / % (х), положим затем 

/ 2 {х)—^х п ^§(х) = /з (*), (8 2 ) 

°0 

и т. д. 

Так как степени многочленов / г (л:), / 2 (л:), . . , убывают, п > п х >> 
>» п 2 > ..., то мы дойдем после конечного числа шагов до такого 
многочлена / к (х), 


/*- 1 (*) — ^ (4 = Л (*), ( 8 *- і > 

степень которого п к меньше после чего наш процесс останавли- 
вается. Складывая теперь равенства (8), (8 Х ), . . ., (8 Й _ х ), мы получим: 

/С*)-(|2л: в -*+^*«.-* + ... + ~^х"к->-^ ё (х)=/ к (х), 
т. е. многочлены 

д( Х ) = ^Х п -*+^Х’'г-°+ ... -V*-.-*, 

г{х)=/ к (х) 

действительно удовлетворяют равенству (6), причем степень г (л:) на 
самом деле меньше степени ^(д:). 

Заметим, что многочлен <7 (х) называется частным от деления /(х) 
на ^(д:), а г (х) — остатком от этого деления. 

Из рассмотрения алгоритма деления с остатком легко устанавли- 
вается, что если /(х) и $ (х) являются многочленами с действитель- 
ными коэффициентами, то коэффициенты всех многочленов 
/ х (х), / 2 (л:), ..., а поэтому и коэффициенты частного д (х) 
и остатка г {х) будут действительными. 

§ 21. Делители. Наибольший общий делитель 

Пусть даны ненулевые многочлены /(л:) и у(х) с комплексными 
коэффициентами. Если остаток от деления /(х) на ср (х) равен нулю, 
т. е., как говорят, ф(х) делится - (или нацело делится) на ф(д:), 
то многочлен ф (де) называется делителем многочлена /{х). 

Многочлен ф (лг) тогда и только тогда будет делителем много- 
члена /{х), если существует многочлен ф (х), удовлетворяющий 
равенству 

/М = ф (х) ф (*). (1) 

В самом деле, если ф (х) является делителем для /{х), то в ка- 
честве ф(дг) следует взять частное от деления /(х) на ф (л:). Обратно, 
пусть многочлен ф (х), удовлетворяющий равенству (1), существует. 
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Из доказанной в предшествующем параграфе единственности много- 
членов ^ (л:) иг (л:), удовлетворяющих равенству 

/{х) = Ч>(х)д (х) + г(х) 

и условию, что степень г (х) меньше степени ф (лг), в нашем случае 
следует, что частное от деления /( х ) на ф (х) равно ф (лг), а остаток 
равен нулю. 

Понятно, что если равенство (1) имеет место, то фД) также 
будет делителем для /(х). Очевидно, далее, что степень фД) 
не больше степени /( х ). 

Заметим, что если многочлен /(л:) и его делитель ф (х) имеют 
оба рациональные или действительные коэффициенты, то и много- 
член ф(лг) также будет иметь рациональные, или, соответственно, 
действительные коэффициенты, так как он разыскивается при помощи 
алгоритма деления. Конечно, многочлен с рациональными или дей- 
ствительными коэффициентами может обладать и такими делителями, 
не все коэффициенты которых рациональны или, соответственно, 
действительны. Это показывает, например, равенство 

х 2 + 1 = (х — /) (лг-Н). 

Укажем некоторые основные свойства делимости многочленов, 
которые найдут в дальнейшем многочисленные применения. 

I. Если /(х) делится на §{х), а $(х) делится на /г(х), то /(х) 
будет делиться на Н(х). 

В самом деле, по условию /(х) = $ (х) у (х) и &(х) = к{х)^(х\ 
а поэтому /(х) — к {х) [ф (х) ф (л:)]. 

II. Если /(. х ) и § {х) делятся на ф (х), то их сумма и раз- 
ность также делятся на ф (л:). 

Действительно, из равенств /(х) ==ф (х) ф (х) и $ (*) = ф (х) % (х) 
вытекает / (л:) ± § (х) = Ф (х) [ф (х) ± х (*)]. 

III. Если / (х) делится на ф (х), то произведение /{х) на любой 
многочлен §{х) также будет делиться на ф (л;). 

Действительно, еслиДл:) = ф(лг)ф(л:), тоДл:)Д*) =ф(*)[ф(лг)^(л;)]. 

Из II и III вытекает следующее свойство: 

IV. Если каждый из многочленов Д (х), Д (лг), . .., Д(л:) де- 
лится на ф(лг), то на ф(лг) будет делиться и многочлен 

А( х ) ёі (х)+/ 2 {х) ёг (х)+ ... +/*Мй(4 

где § х {х), $ 2 (х), ..., & к (х) — произвольные многочлены. 

V. Всякий многочлен /(х) делится на любой многочлен нуле- 
вой степени. 

Действительно, если /(х) = а 0 х п -\-а 1 х п ~ 1 -+- ... +а п , а с — про- 
извольное число, не равное нулю, т. е. произвольный многочлен 
нулевой степени, то 

= ... 
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VI. Если /( х ) делится на ф {х), то /( х ) делится и на сф(л:), 
где с — произвольное число , отличное от нуля. 

В самом деле, из равенства /(х) =ф (х) ф (ж) следует равенство 

/(•*) — 1 С Ф (■*)]• [с -1 ф(Дг)]. 

VII. Многочлены с/(х), сфО, и только они будут делителями 
многочлена /( х ), имеющими такую же степень, что и /(х). 

Действительно, / {х) — с~ 1 [с / (х)}, т. е. /(х) делится на с/(х). 

Если, с другой стороны, /( х ) делится на ф (л:), причем степени 
/(х) и ф (х) совпадают, то степень частного от деления /(х) на ф(лг) 
должна быть равной нулю, т. е. / (х) ~ (х) , дфО, откуда 

Ф (х) = а~ 1 /(х). 

Отсюда вытекает следующее свойство: 

VIII. Тогда и только тогда многочлены /(х), §{х) одновременно 
делятся друг на друга, если §(х) = с/(х), сф 0. 

Наконец, из VIII и I вытекает свойство 

IX. Всякий делитель одного из двух многочленов /(х), с/(х), 
где с Ф 0, будет делителем и для другого многочлена. 

Наибольший общий делитель. Пусть даны произвольные много- 
члены /{х) и ^(я). Многочлен ф(лг) будет называться общим дели- 
телем для /(х) и ${х), если он служит делителем для каждогр из 
этих многочленов. Свойство V (см. выше) показывает, ч то к числу 
общих делителей многочленов /(х) и §(х) принадлежат все много- 
члены нулевой степени. Если других общих делителей эти два много- 
члена не имеют, то они называются взаимно простыми. 

В общем же случае многочлены /(л:) и ^(л:) могут обладать 
делителями, зависящими от х, и мы хотим ввести понятие о наи- 
большем общем делителе этих многочленов. 

Было бы неудобным принять такое определение, по которому 
наибольший общий делитель многочленов /(х) и ^(х) есть их общий 
делитель наибольшей степени. С одной стороны, мы не знаем пока, 
не будут ли /(х) и $(х) обладать многими различными общими 
делителями наибольшей степени, отличающимися друг от друга 
не только на множитель нулевой степени, т. е. не содержит ли это 
определение слишком большой неопределенности. С другой стороны, 
читатель уже встречался в элементарной арифметике с задачей разы- 
скания наибольшего общего делителя целых чисел и знает, что наи- 
больший общий делитель б целых чисел 12 и 18 не только является 
наибольшим среди общих делителей этих чисел, но даже делится 
на любой другой их общий делитель; действительно, другими общими 
делителями чисел 12 и 18 будут числа 1, 2, 3, — 1, — 2, — 3, — 6. 

Мы примем поэтому для случая многочленов такое определение: 

Наибольшим общим делителем отличных от нуля многочленов 
/{х) и ^(д;) называется такой многочлен й (х), который является 
их общим делителем и, вместе с тем, сам делится на любой другой 
общий делитель этих многочленов. Обозначается наибольший общий 
делитель многочленов /(х) и §(х) символом (/(л:), <§•(-*)).. 
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Это определение оставляет открытым вопрос, существует ли наи- 
больший общий делитель для любых многочленов /(лг) и &(х). Сейчас 
на этот вопрос будет дан положительный ответ. Одновременно будет 
дан метод для практического разыскания наибольшего общего дели- 
теля данных многочленов. Понятно, что мы не можем перенести сюда 
тот способ, каким обычно разыскивается наибольший общий делитель 
целых чисел, так как пока не имеем для многочленов ничего ана- 
логичного разложению целого числа в произведение простых множи- 
телей. Для целых чисел существует, однако, и другой способ, назы- 
ваемый алгоритмом последовательного деления или алгоритмом 
Евклида ; этот способ вполне применим и к многочленам. 

Алгоритм Евклида для многочленов состоит в следующем. Пусть 
даны многочлены /(. х ) и §(х). Делим /(х) на @(х) и получаем, 
вообще говоря, некоторый остаток г х (х). Делим затем §(х) на г х (х) 
и получаем остаток г 2 ( х ), делим г х (х) на г 2 (х) и и т. д. Так как сте- 
пени остатков все время понижаются, то в этой цепочке последова- 
тельных делений мы должны дойти до такого места, на котором 
деление совершится нацело и поэтому процесс остановится. Тот 
остаток г к (х), на который нацело делится предыдущий остаток 
Г к _і (х), и будет наибольшим общим делителем многочленов / (х) 
и §{х). 

Для доказательства запишем изложенное в предыдущем абзаце 
в виде следующей цепочки равенств: 


/(х) = і(х) (х) + г х (х), 
ё(х)=г х (х)д 2 (х) + г 2 (х), 
Гі{х) = г г {х) д 3 (х) + г 8 (х), 


Гк-з( х )^ г к-2 {*) Як- і( х ) + г к -і (*), 
Г к- 2 (■*) = г к- 1 (*) Як ( х ) + г к ( х ), 

Г к - 1 (х) = г к (х)д к+1 (х). 


( 2 ) 


Последнее равенство показывает, чтог А (д:) служат делителем для 
г к- 1 (•*■)• Отсюда следует, что оба слагаемых правой части предпо- 
следнего равенства делятся на г к (х), а поэтому г к (л:) будет делителем 
и для г к _ 2 (х). Далее, таким же путем, поднимаясь вверх, мы полу- 
чим, что г к (х) является делителем и для г А _ 3 ( х), г 2 (х), г х {х). 

Отсюда, ввиду второго равенства, будет следовать, что г к (х) служит 
делителем для §(х), а поэтому, на основании первого равенства, — 
и для /{х). Таким образом, г к (х) является общим делителем для 

/(■*) и ё(х)- 

Возьмем теперь произвольный общий делитель <р (л;) многочленов 
/(х) и ^(д:). Так как левая часть и первое слагаемое правой части 
первого из равенств ( 2 ) делятся на ф (л:), то г х (х) также будет 
делиться на ф(дг). Переходя ко второму и следующему равенствам, 



§ 21] ДЕЛИТЕЛИ. НАИБОЛЬШИЙ ОБЩИЙ ДЕЛИТЕЛЬ 139 

мы таким же способом получим, что на ф (л:) делятся многочлены 
г. 2 (х), г г (х), ... Наконец, если уже будет доказано, что г к _ г (х) и 
г а-і ( х ) Делятся на ф (ж), то из предпоследнего равенства мы получим, 
что г к (х) делится на ф (лс). Таким образом, г к (х) на самом деле 
будет наибольшим общим делителем для /(х) и @(х). 

Мы доказали, следовательно, что любые два многочлена обладают 
наибольшим общим делителем, и получили способ для его вычисления. 
Этот способ показывает, что если многочлены /{х) и §(х) имеют 
оба рациональные или действительные коэффициенты , то и коэф- 
фициенты их наибольшего общего делителя также будут рацио- 
нальными или, соответственно , действительными, хотя, конечно, 
у этих многочленов могут существовать и такие делители, не все 
коэффициенты которых рациональны (действительны). Так, много- 
члены с рациональными коэффициентами 

/ (х) — х 3 — За; 2 — 2л: + 6, § (л:) = х 3 + л: 2 — 2л: — 2 

имеют наибольшим общим делителем многочлен с рациональными 
коэффициентами х 2 — 2, хотя у них есть общий делитель х — У"2, 
не все коэффициенты которого рациональны. 

Если й (х) есть наибольший общий делитель многочленов /(х) и 
§(х), то, как показывают свойства VIII и IX (см. выше), в качестве 
наибольшего общего делителя этих многочленов можно было бы 
выбрать также многочлен ей (я), где с — произвольное число, отличное 
от нуля. Иными словами, наибольший общий делитель двух много- 
членов определен лишь с точностью до множителя нулевой 
степени. Ввиду этого можно условиться, что старший коэф- 
фициент наибольшего общего делителя двух много- 
членов будет всегда считаться равным единице. 
Используя это условие, можно сказать, что два многочлена тогда 
и только тогда взаимно просты, если их наибольший общий 
делитель равен единице. В самом деле, в качестве наибольшего 
общего делителя двух взаимно простых многочленов можно взять 
любое число, отличное от нуля, но, умножая его на обратный эле- 
мент, мы получим единицу. 

Пример. Найти наибольший общий делитель многочленов 
/(х)=х 4 + 3х 3 — х 2 — 4х— 3, § (х) = 3л 3 +10л г + 2х— 3. 

Применяя алгоритм Евклида к многочленам с целыми коэффициентами, 
мы можем, чтобы избежать дробных коэффициентов, умножить делимое или 
сократить делитель на любое не равное нулю число, причем не только начи- 
ная какое-либо из последовательных делений, но и в процессе самого этого 
деления. Это будет приводить, понятно, к искажению частного, но интере- 
сующие нас остатки будут приобретать лишь некоторый множитель нулевой 
степени, что, как мы знаем, при разыскании наибольшего общего делителя 
допускается. 
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Делим /(л) на §(л), предварительно умножив / (л) на 3: 

Зх 4 + 9л 3 — Зл 2 — 12*— 9 I Зх 8 + 10х г + 2х— 3 
Зл 3 4- 10л 3 4- 2л 2 — Зх |л-Ц 
— х 3 — 5л 2 — 9л — 9 

(умножаем на — 3) 

Зл 3 + 1 5л 2 + 27л + 27 
Зл 3 + Ю* 2 +2х— 3 
5л 2 + 25л + 30. 

Таким образом, первый остаток, после сокращения на 5, будет г 1 (л) = 
■=х 2 + 5л + 6. Делим иа него многочлен §(х): 

Зл 3 + 10л 2 + 2л— 3 л 2 + 5л + 6 
Зл 3 + 15л 2 4- 18л Зл — 5 

— 5л 2 — 16л — 3 
—5л 2 — 25л— 30 
9л 4- 27. 

Вторым остатком, после сокращения на 9, будет, следовательно, 
г 2 (л) = л4-3. Так как 

Гі (л) = /- 2 (х) (л 4- 2), 

то г 2 (х) будет тем последним остатком, на который нацело делится пред- 
шествующий остаток. Он будет, таким образом, искомым наибольшим общим 
делителем: 

(/.(*). 8 (*))=* + 3. 

Используем алгоритм Евклида для доказательства следующей 
теоремы: 

Если й (я) есть наибольший общий делитель многочленов /(. х ) 
и §(х), то можно найти такие многочлены и(х) и ѵ(х), что 

/(х)и{х)+%{х)ѵ{х) = й{х). (3) 

Можно считать при этом, если степени многочленов /{х) и §(х) 
больше нуля, что степень и(х) меньше степени ^{х), а степень 
ѵ(х) меньше степени /{х). 

Доказательство основано на равенствах (2). Если мы учтем, что 
г к (х) = й(х), и положим 'и х (х) = \,- ѵ х (х) — — Чь(х), то предпо- 
следнее из равенств (2) даст: 

сі (х) = г*_ 2 (л:) и х (х) + г к _ х (х) ѵ х ( х ). 

Подставляя сюда выражение г к _ х (х) через г к _ 3 (х) и г А _ 2 (л:) из пред- 
шествующего равенства (2), мы получим: 

4{*)= г ь - з (*) и 2 (х)+г к _ 2 (х) ѵ 2 (х), 

где, очевидно, и 2 ( х)=ѵ х (х), ѵ 2 (х) = и х (х)—ѵ х (х)д к _ х (х). Про- 
должая подниматься вверх по равенствам (2), мы придем, наконец, 
к доказываемому равенству (3). 

Для доказательства второго утверждения теоремы предположим, 
что многочлены и (л:) и ѵ(х), удовлетворяющие равенству (3), уже 
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найдены, но, например, степень и (х) больше или равна степени &(х). 
Делим и(х ) на &(х): 

и(х) = ^(х)д(х) + г(х), 

где степень г(х) меньше степени §{х), и подставляем это выраже- 
ние в (3). Мы получим равенство 

/( х ) г {х) + §{х) [ѵ (х) +/(х) у (X)] = й {х). 

Степень множителя, стоящего при /(х), уже меньше степени § (х). Сте- 
пень многочлена, стоящего в квадратных скобках, будет в свою 
очередь меньше степени /( х ), так как в противном случае степень 
второго слагаемого левой части была бы не меньше степени произ- 
ведения §(х)/(х), а так как степень первого слагаемого меньше 
степени этого произведения, то вся левая часть имела бы степень, 
большую или равную степени &(х)/(х), тогда как многочлен й{х ) 
заведомо имеет, при наших предположениях, меньшую степень. 

Теорема доказана. Одновременно мы получаем, что если много- 
члены /(х) и §(х) имеют рациональные или действительные коэф- 
фициенты, то и многочлены и (х) и ѵ (х), удовлетворяющие равен- 
ству (3), можно подобрать так, что их коэффициенты будут рацио- 
нальными или, соответственно, действительными. 

Пример. Найдем многочлены и (х) и ѵ(х), удовлетворяющие равен- 
ству (3) при 

I (х) = х 3 — х 2 + 3х — 10, §(х) = х 3 + 6х 2 — Эх — 14. 

Применим к этим многочленам алгоритм Евклида, причем теперь при 
выполнении делений уже нельзя допускать искажения частных, так как эти 
частные используются при разыскании многочленов и (х) и ѵ (х). Мы полу- 
чим такую систему равенств: 

(,\х) —8 (х) + ( — 7х 2 + 12х + 4); 

?(*)=( — 7х 2 + 12х-Н) х-||)+^(х— 2); 

— 7х 2 +12х + 4 = (х — 2)(— 7х— 2). 

Отсюда следует, что ([(х), $ (х)) =х — 2 и что 

. . 7 , 54 . 7 5 

“ ( * ) “23б Х + 235’ 235 ^ 235 ‘ 

Применяя доказанную сейчас теорему к взаимно простым много- 
членам, мы получаем такой результат: 

Многочлены /(х) и і?(х) тогда и только тогда взаимно просты, 
если можно найти многочлены и(х) и ѵ (х), удовлетворяющие 
равенству 

/(х)и{х) + §{х)ѵ{х) = 1. (4) 

Опираясь на этот результат, можно доказать несколько простых, 
но важных теорем о взаимно простых многочленах: 
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а) Если многочлен /( х ) взаимно прост с каждым из много- 
членов ф (х) и ф (я), то он взаимно прост и с их произведением. 

В самом деле, существуют, по (4), такие многочлены и ( х ) и 

что 

/(х) и (х) + ф {х) ѵ (ж) = 1. 

Умножая это равенство на ф(дг), получаем: 

/(х) [и (х) ф (л)] + [ф (х) ф (*)] ѵ (х) х=ф (ж), 

откуда следует, что всякий общий делитель /{х) и ф (х) ф(д:) был бы 
делителем и для ф (л:); однако по условию {/(х), ф(д:))=1. 

б) Если произведение многочленов /(х) и &(х) делится на ф (х), 
но /(х) и ф (х) взаимно просты, то §(х) делится на ф(дг), 

В самом деле, умножая равенство 

/(х) и (х) + ф (х) ѵ (х) — 1 

на е(х), мы получим: 

[/ (х) Е (*)] и (х ) + Ф (х) [ѵ (х) § (*)] =*е{х). 

Оба слагаемых левой части этого равенства делятся на ф (х)’, на него 
делится, следовательно, и §(х). 

в) Если многочлен /(х) делится на каждый из многочленов 
Ф(д:) и ф(-ѵ), которые между собой взаимно просты, то /(х) 
делится и на их произведение. 

Действительно, / (х) = ф (х) ф (л:), так что_произведение, стоящее 
справа, делится на ф (дг). Поэтому, по б), ф (х) делится на ф(х), 
Ф {х) = ф (дг) ф (Дг), откуда / (х) = [ф (дг) ф (х)] ф (х). 

Определение наибольшего общего делителя может быть распро- 
странено на случай любой конечной системы многочленов: наибольшим 
общим делителем многочленов Д (х), Д(х), Д(х) называется 
такой общий делитель этих многочленов, который делится на любой 
другой общий делитель этих многочленов. Существование наибольшего 
общего делителя для любой конечной системы многочленов вытекает 
из следующей теоремы, дающей также способ его вычисления. 

Наибольший общий делитель многочленов Д (х), Д (дг), . . , , Д (х) 
равен наибольшему общему делителю многочлена Д(х) и наиболь- 
шего общего делителя многочленов Д (х), Д(х), ..., Д-Дя). 

В самом деле, при 5 = 2 теорема очевидна. Мы примем поэтому, 
что для случая 5 — 1 она справедлива, т. е., в частности, ужѳ дока- 
зано существование наибольшего общего делителя й ( х ) многочленов 
Д (х), Д (■*), . • • , Д_і (л). Обозначим через й (. х ) наибольший общий 
делитель многочленов й (х) и Д(х). Он будет, очевидно, общим 
делителем для всех заданных многочленов. С другой стороны, всякий 
другой общий делитель этих многочленов будет делителем также и 
для й (х), а поэтому и для й (х). 
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В частности, система многочленов Д (ж), / 2 (х), . . . , / 5 (х) назы- 
вается взаимно простой, если общими делителями этих многочленов 
являются лишь многочлены нулевой степени, т. е. если их наибольший 
общий делитель равен 1. Если 5 >2, то попарно эти многочлены 
могут и не быть взаимно простыми. Так, система многочленов 

/(х) =х 3 — 7х 2 -\-7х-\- 15, &{х) —х 2 — х — 20, 

к (х) = х 3 + х 2 — 1 2х 

взаимно проста, хотя 

(/{X), §(х))=х — 5, (/(х), к(х)) =х — 3, (${х), к(х)) = х + 4. 

Читатель без труда получит обобщение доказанных выше теорем 
а) — в) о взаимно простых многочленах на случай любого конечного 
числа многочленов. 


§ 22. Корни многочленов 

Мы уже встречались в § 20 со значениями многочлена, когда 
говорили о теоретико-функциональной точке зрения на понятие 
многочлена. Напомним определение. 

Если 

/(*) = а 0 х п + а х х п ~ 1 + ... +о„ (1) 

есть некоторый многочлен, а с — некоторое число, то число 
/(с) = а 0 с'Ч-а 1 с п - і + ... +а и , 

полученное заменой в выражении (1) для /( X ) неизвестного де числом с 
и последующим выполнением всех указанных операций, называется 
значением многочлена / (лг) при х = с. Понятно, что если / (х) ~ §(х) 
в смысле алгебраического равенства многочленов, определенного 
в § 20, то /{с) — §(с) при любом с. 

Легко видеть также, что если 

Ф ( х ) — /( х ) +ІГ (■*■)> Ф (*)=/(*)§•(*), 

то 

ф (с) =/ (с) + ^(с), ф(с)=/(с)^(с). 

Иными словами, сложение и умножение многочленов, определенные 
в § 20, превращаются при теоретико-функциональной точке зрения 
на многочлены в сложение и умножение функций, понимаемые в смысле 
сложения или умножения соответственных значений этих функций. 

Если /(с) = 0, т. е. многочлен /{х) обращается в нуль при под- 
становке в него числа с вместо неизвестного, то с называется корнем 
многочлена /(х) (или уравнения /(д:) = 0). Сейчас будет показано, 
что это понятие целиком относится к той теории делимости много- 
членов, которая была предметом изучения в предшествующем пара- 
графе. 
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Если мы будем делить многочлен /( х ) на произвольный много- 
член первой степени (или, как будем говорить дальше, на линейный 
многочлен), то остаток будет либо некоторым многочленом нулевой 
степени, либо нулем, т. е. во всяком случае некоторым числом г. 
Следующая теорема позволяет найти этот остаток, не выполняя 
самого деления, в случае, когда производится деление на многочлен 
вида х — с. 

Остаток от деления многочлена /(х) на линейный многочлен 
х — с равен значению /(с) многочлена /(х) при х = с. 
Действительно, пусть 

/(х) = (х—с)д(х) + г. 

Беря значения обеих частей этого равенства при х — с, мы получаем: 

У(с) = (с — с)?(с) + г = г, 
что доказывает теорему. 

Отсюда вытекает такое исключительно важное следствие: 
Число с тогда и только тогда будет корнем многочлена / (х), 
если /(х) делится на х — с.. 

С другой стороны, если /(х) делится на некоторый многочлен 
первой степени ах-\-Ъ, то делится, очевидно, и на многочлен 

х — ^ ) т . е на мн^очлен вида X — с. Таким образом, разы- 
скание корней многочлена /(х) равносильно разысканию его линей- 
ных делителей. 

Ввиду сказанного выше представляет интерес следующий метод 
деления многочлена /(х) на линейный двучлен х — с, более простой, 
чем общий алгоритм деления многочленов. Этот метод называется 
методом Горнера. Пусть 

/(х) = а 0 х п + а 1 х п - 1 + а 2 х п -*+ (2) 

и пусть 

/(х)=(х—с)я(х)+г,‘ (3) 

где 

д(х) = Ь 0 *'- 1 + Ь 1 хГ-* + Ь г х п -*+ ... +*„_!• 

Сравнивай коэффициенты при одинаковых степенях х в (3), получаем: 

^0 = ^ 0 . 
а 1 = Ь 1 сЬ 0) 

а 2 = ^2 СЪу, 


а п-1 — ^ п-1 с ^п-2> 

а п — г — сЬ п -\- 

Отсюда следует, что Ь 0 = а 0 , Ь к = сЬ к _ 1 -\- а к , 6 = 1, 2, ..., га— 1, 
т. е. коэффициент ^ получается умножением преды- 
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дущего коэффициента Ь к _ 1 на с и прибавлением соот- 
ветствующего коэффициента а к , наконец, г— сЬ п _ х -\- а п , 
т. е. и остаток г, равный, как мы знаем, /(с), получается по этому же 
закону. Таким образом, коэффициенты частного и остаток можно 
последовательно получать при помощи однотипных вычислений, кото- 
рые располагаются в схему, как показывают следующие примеры: 


1. Разделить }(х) = 2х 6 — х і — Зх 3 + х — 3 на х — 3. 

Составим таблицу, в которой над чертой расположены коэффициенты 
многочлена І(х), под чертой — соответствующие коэффициенты частного и 
остаток, последовательно вычисляемые, а слева сбоку — значение с в данном 
примере: 


3 


2—1—3 0 1 —3 

2,3-2— 1 ==5,3-5 — 3 = 12,3- 12 + 0=36,3-36+ 1 = 109,3- 109 — 3 = 324' 


Таким образом, искомое частное будет 

ц (*) = 2х 4 + 5* 3 + 12* 2 + 36* + 109, 
а остаток л = ^(3)=324. 

2. Разделить I (*) = х* — &х 3 + х 2 -)- 4* — 9 на х + 1. 


| 1 — 8 1 

4 

-9 

| 1 -9 10 

— 6 

-3. 


Поэтому частное будет 

^ (х) = х 3 — 9х 2 + 10х — 6, 
а остаток г — [(— 1) = — 3. 


Эти примеры показывают, что метод Горнера может быть 
использован также для быстрого вычисления значения многочлена 
при данном значении неизвестного. 

Кратные корни. Если с — корень многочлена /(*), т. е./(с)=0, 
то /(х) делится, как мы знаем, на х — с. Может оказаться, что 
многочлен /( х ) делится не только на первую степень линейного 
двучлена х — с, но и на более высокие его степени. Во всяком 
случае найдется такое натуральное число к, что /( х ) нацело делится 
на (х — с) к , но не делится на ( х — с) к+1 . Поэтому 

/(*)=(*— с)Ч(*), 

где многочлен ф (х) на х — с уже не делится, т. е. число с своим 
корнем не имеет. Число к называется кратностью корня с в много- 
члене /(х), а сам корень с — к-кратным корнем этого многочлена. 
Если к— 1, то говорят, что корень с — простой. 

Понятие кратного корня тесно связано с понятием производной 
от многочлена. Мы изучаем, однако, многочлены с любыми ком- 
плексными коэффициентами и поэтому не можем просто восполь- 
зоваться понятием производной, введенным в курсе математического 
анализа. То, что будет сказано ниже, следует рассматривать как 



МНОГОЧЛЕНЫ И ИХ КОРНИ 


146 


[гл. 5 


независимое от курса анализа определение производной много- 
члена. 

Пусть дан многочлен п- й степени 

/ (х) = а 0 х п + Яі*" -1 + а„-іХ + а п 

с любыми комплексными коэффициентами. Его производной (или 
первой производной) называется многочлен (п — 1)-й степени 

/' (х) — па 0 х п ~ 1 -{-{п — 1) а 1 х п ~ і + . . . + 2а„_ 2 х +-а„_ 1 . 

Производная от многочлена нулевой степени и от нуля считается 
равной нулю. Производная от первой производной называется вто- 
рой производной от многочлена /( х ) и обозначается через /" (х) 
и т. д. Очевидно, что 

(х) = пІа 0 


и поэтому / <п+1) (х) = 0, т. е. (я + 1)-я производная от многочлена 
п- й степени равна нулю. 

Мы не можем пользоваться в нашем случае многочленов с ком- 
плексными коэффициентами свойствами производной, доказанными 
в курсе анализа для многочленов с действительными коэффициентами, 
и должны, используя лишь данное выше определение производной, 
снова эти свойства доказать. Нас интересуют следующие свойства, 
являющиеся, как говорят, формулами дифференцирования для суммы 
и произведения: 

(/(*)+?(*))'=/%*)+/(*), (4) 

(/ (*) • Е (*))'=/ (х) е' (х) +/' (*) Е (^)- (5) 

Эти формулы легко проверить, впрочем, непосредственным под- 
счетом, беря в качестве /(х) и ЕІ Х ) два произвольных многочлена 
и применяя данное выше определение производной; эту проверку мы 
предоставим читателю. 

Формула (5) без труда распространяется на случай произведения 
любого конечного числа множителей, а поэтому обычным способом 
может быть выведена формула и для производной от степени: 

(/*(х))'==*/*-1(*)/(*). (6) 

Нашей целью является доказательство следующей теоремы: 

Если число с является к-кратным корнем многочлена /( х ), 
то при /%>- 1 оно будет ( к — \)-кратным корнем первой произ- 
водной этого многочлена ; если же к— 1, то с не будет служить 
корнем для /' {х). 

В самом деле, пусть 

/(х) = (х— с) к у(х), &5&1, 


(7) 
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где <р (лг) уже не делится на лг — с. Дифференцируя равенство (7), 
получаем: 


/' (х)—(х — с) й ф' (х)-\-к(х — с) к 1 ф (лг) = 
= (лг — с)* -1 [(х — с) ф' (лг) -ф Аф (лг)]. 


Первое слагаемое суммы, стоящей в квадратных скобках, делится 
на х — с, а второе на х — с не делится; поэтому вся эта сумма 
на лг — с не может делиться. Учитывая, что частное от деления /(х) 
на (л: — с) к ~ г определено однозначно, мы получаем, что (л: — с) А_1 
является наибольшей степенью двучлена лг — с, на которую делится 
многочлен /' (лг), что и требовалось доказать. 

Применяя эту теорему несколько раз, мы получаем, что к-крат- 
ный корень многочлена /(лг) будет (к — э)-кратным в 5-й произ- 
водной этого многочлена (к^з) и впервые не будет служить 
корнем для к-й производной от /(лг). 


§ 23. Основная теорема 

Занимаясь в предшествующем параграфе корнями многочленов, 
мы не ставили вопроса о том, всякий ли многочлен обладает кор- 
нями. Известно, что существуют многочлены с действительными 
коэффициентами, не имеющие действительных корней; лг 2 -ф1 — один 
из таких многочленов. Можно было бы ожидать, что существуют 
многочлены, не имеющие корней даже среди комплексных чисел, 
особенно если рассматриваются многочлены с любыми комплексными 
коэффициентами. Если бы это было так, то система комплексных 
чисел нуждалась бы в дальнейшем расширении. На самом деле, 
однако, справедлива следующая основная теорема алгебры 
комплексных чисел: 

Всякий многочлен с любыми числовыми коэффициентами, 
степень которого не меньше единицы, имеет хотя бы один 
корень , в общем случае комплексный. 

Эта теорема является одним из крупнейших достижений всей 
математики и находит применения в самых различных областях 
науки. На ней основана, в частности, вся дальнейшая теория мно- 
гочленов с числовыми коэффициентами, и потому эту теорему назы- 
вали раньше (а иногда называют и теперь) «основной теоремой 
высшей алгебры». В действительности, однако, основная теорема 
не является чисто алгебраической. Все ее доказательства,— а их, 
после Гаусса, впервые доказавшего эту теорему в самом конце 
XVIII века, было найдено весьма много, — принуждены в большей 
или меньшей мере использовать так называемые топологические 
свойства действительных и комплексных чисел, т. е. свойства, 
связанные с непрерывностью. 

В доказательстве, которое будет сейчас проведено, многочлен 
/ (лг) с комплексными коэффициентами будет рассматриваться как 
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комплексная функция комплексного переменного х. Таким образом, х 
может принимать любые комплексные значения, т. е., как говорят, 
учитывая изложенный в § 17 способ построения комплексных чисел, 
переменное х изменяется на комплексной плоскости. Значения 
функции /(,ѵ) также будут комплексными числами. Можно считать, 
что эти значения отмечаются на втором экземпляре комплексной 
плоскости, подобно тому как в случае действительных функций 
действительного переменного значения независимого переменного 
отмечаются на одной числовой прямой (оси абсцисс), а значения 
функции — на другой (оси ординат). 

Определение непрерывной функции, известное читателю из курса 
математического анализа, переносится и на функции комплексного 
переменного, причем в формулировке определения абсолютные вели- 
чины заменяются модулями. 

Именно, комплексная функция /(х) комплексного переменного х 
называется непрерывной в точке лг 0 , если для всякого положитель- 
ного действительного числа е можно подобрать'такое положительное 
действительное число б, что, каково бы ни было (вообще говоря, 
комплексное) приращение Н, модуль которого удовлетворяет нера- 
венству [й|<Сб, будет справедливым также неравенство 

І/(*о + й) — /{х 0 ) | <е. 

Функция /(х) называется непрерывной, если оиа непрерывна во всех 
точках лг 0 , в которых она определена, т. е. если /(х) является 
многочленом, '-на всей комплексной плоскости. 

Многочлен /(х) является непрерывной функцией комплексного 
переменного х. 

Доказательство этой теоремы можно было бы провести так же, 
как это делается в курсе математического анализа, а именно, пока- 
зав, что сумма и произведение непрерывных функций сами непре- 
рывны, и заметив, что функция, постоянно равная одному и тому же 
комплексному числу, будет непрерывной. Мы пойдем, однако, иным 
путем. 

Докажем сначала частный случай теоремы, а именно случай, 
когда свободный член многочлена /( х ) равен нулю, причем докажем 
лишь непрерывность /(х) в точке х 0 =0. Иными словами, мы 
докажем следующую лемму (вместо И мы пишем х): 

Лемма 1. Если свободный член многочлена /(х) равен нулю : 

/{х) = а 0 х п + а 1 х п - 1 + . . . 

т. е. / (0) = 0, то для всякого е>0 можно подобрать такое 
6>0, что при всех х, для которых |х|<б, будет |/(х)|<Се. 

Действительно, пусть 


<4 = шах ([ а 0 1, [ ), . . ., 


К-іІ)- 
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б Ыі’ 

то оно будет удовлетворять требуемым условиям. 

В самом деле, 

|/ (х) | | а 0 1 1 Л' I" + 1 а х 1 1 х і"" 1 + . . . + ] а п _ х 1 1 х | < 


(1) 


т. е. 




і-ні 

Так как | х \ <. б и, по (1), 6<1, то 


|*| п + 1 


1 — |*І 


< 


1-1*1 ’ 


и поэтому 


А |*| 


А 6 




А +е 


б 1 е 


— в. 


А +е 

что и требовалось доказать. 

Выведем теперь следующую формулу. Пусть дан многочлен 


/(х) = а 0 х п + а 1 х п - 1 + .. . +а п _ 1 х-\-а п 


с любыми комплексными коэффициентами. Подставим в него вместо х 
сумму х-\-к, где к — второе неизвестное. Разлагая в правой части 
каждую из степеней (х~\-к) к , к^п, по формуле бинома и собирая 
вместе члены с одинаковыми степенями к, мы получим, как читатель 
без труда проверит, равенство 

иг ип 

/(х + к)=/(х) + кГ (х) +|гГ (*)+... + ~Г (х), 


т. е. докажем формулу Тэйлора , дающую разложение /{хф к) 
по степеням «приращения» к. 

Непрерывность произвольного многочлена /(х) 
в любой точке Хо доказывается теперь следующим образом. 
По формуле Тэйлора 

/ {х 0 + к ) — / (а о) = с х к + с 2 Л 2 + . . . 4- с п к п = ср (к), 


с г ~/’{х о), с 2 = -щ/” (Хо), 


с п =-^/ 1Щ (Хо). 


где 
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Многочлен ф (к) от неизвестного к есть многочлен без свободного 
члена, поэтому, по лемме 1, для всякого е>0 можно подобрать 
такое 6>0, что при | А ( <1 6 будет |ф(й)|<;е, т. е. 

I /(лг 0 4- к) — / (х 0 ) ) < е, 

что и требовалось доказать. 

Из неравенства 

I і / (*о + А) | — I / (*о) 1 1 < | / (*о + А) — / (*о) I , 

основанного на формуле (13) § 18, и из доказанной сейчас непре- 
рывности многочлена вытекает непрерывность модуля \/(х) \ мно- 
гочлена /( х ); этот модуль является, очевидно, действительной неот- 
рицательной функцией комплексного переменного х. 

Сейчас будут доказаны леммы, используемые при доказательстве 
основной теоремы. 

Лемма о модуле старшего член$. Если дан много- 
член п-й степени , п^\, 

/{х)=а 0 х п + а 1 х п ~ 1 + а 2 х п - 2 + . ,.+а п 

с произвольными комплексными коэффициентами и если к — 
любое положительное действительное число, то для доста- 
точно больших по модулю значений неизвестного х имеет 
место неравенство 

К*"|>А| а 1 х п ~ 1 + а г х п - г + . . . + с„|, (2) 

т. е, модуль старшего члена будет больше модуля суммы всех 
остальных членов, притом во сколько угодно раз. 

В самом деле, пусть Л — наибольший из модулей коэффициен- 
тов а х , а. 2 , .... а п : 

А = шах (! а х |, \а 2 \ |а„|). 

Тогда (см. в § 18 свойства модулей суммы и произведения ком- 
плексных чисел) 

| а г х п - 1 + а г х п ~ г + . . . + а п | < ( а х | | л: Г -1 + 1 а г 1 1 ,ѵ |"" 2 + . . . 

...+|а^<Л(|л:Г-і + |.ѵГ- 2 + ...+1)==4І^. 

Полагая |х|>1, мы получим: 

I лг I” — 1 \х\ п 
I х ! 1 ^'1*1 — 1 ’ 

I а х х п - х + а х х п ~ г + . . . + а„\ < А . 


откуда 
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Таким образом, неравенство (2) будет выполняться, если х удовле- 
творяет, помимо условия ]л|>1, также неравенству 


кА 


\х\ п 

хІ—Г 


а п х 


т, е. если 


кА 

КІ 


+ 1 . 


( 3 ) 


Так как правая часть неравенства (3) больше 1, то можно утвер- 
ждать, что для значений х, удовлетворяющих этому неравенству, 
имеет место неравенство (2), что доказывает лемму. 

Лемма о возрастании модуля многочлена. Для 
всякого многочлена /( х ) с комплексными коэффициентами, 
степень которого не меньше единицы, и всякого положительного 
действительного числа М, сколь угодно большого, можно подо- 
брать такое положительное действительное число Ы, что при 
|*|>ІѴ будет |/(*)|>М. 

Пусть 

/(х) = а 0 х п + а 1 х п ~ 1 + . , . +а п . 

По формуле (11) § 18 

\/{х)\ = \а 0 х п + (а 1 х п - 1 + ...+а п )\^ 

^\а 0 х п \ — \а х х п - 1 +...-\-а п \. (4) 

Применим лемму о модуле старшего члена, положив к = 2: суще- 
ствует такое число ЛГ 1 , что при | л; | > будет 

I а о х '‘ I > 2 | а^' 1 + . . . + а п |. 

Отсюда 

! ^х' 1 - 1 + . . . + а п | <у| а 0 х п |, 

т. е., по (4), 

\/(х) | > | «о*” |— у I а о хП 1 = 4 I а ° хП I* 


Правая часть этого неравенства будет больше М при 


\х | > N. 


_ "Д ш_ 

~ У і««і ' 


Таким образом, при |л:|>Л ? =шах(іѴ 1 , ТѴ 2 ) будет \/{х)\ >Л4. 

Смысл этой леммы может быть выяснен при помощи следующей 
геометрической иллюстрации, которая в настоящем параграфе будет 
неоднократно использоваться. Предположим, что в каждой точке х 0 
комплексной плоскости к этой плоскости восставлен перпенди- 
куляр, длина которого (при заданной единице масштаба) равна 
модулю значения многочлена /( х ) в этой точке,, т. е. равна |/(д: 0 )|. 
Концы перпендикуляров будут составлять ввиду доказанной выше 
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возрастании ] л: 0 1 


непрерывности модуля многочлена некоторую непрерывнуюкривую по- 
верхность, расположенную над комплексной плоскостью. Лемма о воз- 
растании модуля многочлена показывает, что эта поверхность при 
все больше и больше удаляется от комплексной 
плоскости, хотя, понятно, это удаление 
вовсе не является монотонным. Рис. 8 
схематически изображает линию пересе- 
чения этой поверхности с плоскостью, 
перпендикулярной к комплексной пло- 
скости и проходящей через точку О. 

Основную роль в доказательстве иг- 
рает следующая лемма: 

Лемма Даламбера. Если при 
х = х 0 многочлен /{х) степени п, л 5* 1, 
не обращается в нуль , /(х 0 )Ф 0 и по- 
этому \/{х 0 ) | >0, то можно найти такое приращение Н, в общем 
случае комплексное , что 

/(*о + л )І <!/(*•) I- 

По формуле Тэйлора, если приращение Н пока 
будет 



произвольно, 


/<*о + Л) -/(*,) + */'(* о) + -5г/"(*о)+ • • •+5/'" , Ю- 


По условию, х 0 не является корнем для /(х). Случайно, однако, 
это число может оказаться корнем для /' (л:), а также, быть может, 
для некоторых из дальнейших производных. Пусть к - я производ- 
ная (к^\) будет первой, не имеющей ;с 0 своим корнем, т. е. 

/'(*о) =/"(*„)= ... =Г- І> (*о) = 0, Г к) {х й )ф0. 


Такое к существует, так как, если а 0 есть старший коэффициент 
многочлена /(х), то 

/ т (х 0 ) = л!а 0 =^ 0 . 


Таким образом, 


Некоторые из чисел / (й+1> (лг 0 ), . . • , Л -1 ’ (*о) также могут равняться 
нулю, но это для нас несущественно. 

Деля обе части этого равенства на /( х 0 ), отличное, по условию, 
от нуля, и вводя обозначение 


, Л(*о) 

1 !Ч(х оУ 


І=к, к+ 1, 


п. 
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мы получим: 

Г1 ТЙГ = 1 + СкНк + с ^ нк+1 + • • • + С » А " 

или, ввиду С к ф О, 

Переходя к модулям, получим: 

Г‘тЙгі <|1 + с ^ і+ і С4А4 і| 5 ^ 1 л+-.. + -^а"“*|- (5) 

До этого момента мы не делали никаких предположений о при- 
ращении /г. Теперь мы будем выбирать Н, причем будем отдельно 
выбирать его модуль и его аргумент. Модуль к будет выбираться 
следующим образом. Так как 

с -±±±к+ ...+^к п ~ к 

с к с к 

является многочленом от к без свободного члена, то, по лемме 1 
^полагая можно найти такое 6 Х , что при | /г | < будет 

| г ?Г Л +--+|-**-‘| < Т’ < 6 > 

С другой стороны, при 

\Ь\<К = ѴЫ Г1 

будет 

1«*А*1<1. (7) 

Положим, что модуль к выбран в соответствии с неравенством 

|А|<шіп(б 1 , й 2 ). (8) 

Тогда, ввиду (6), неравенство (5) превращается в строгое неравен- 
ство 

+ + О) 

условием (7) мы воспользуемся лишь позже. 

Для выбора аргумента к потребуем, чтобы число с к к к было 
отрицательным действительным числом. Иными словами, 

аг& (с к к к ) = аг& с к + к ат§ к = я, 


откуда 


« г * = “=р» 


(10) 
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При этом выборе к число с к Н к будет отличаться знаком от своей 
абсолютной величины, 


с к к* = 


I с к Н к I 


а поэтому, используя неравенство (7), 

1 1 + с к нк I = 1 1 — ! С Х 11 = 1—1 |. 

Таким образом, при выборе к на основании условий (8) и (10) 
неравенство (9) принимает вид 


/(Хр + 'О 
І(х о) 


<1-|с а Л а |+-І|с 


ь к Н к | = 1— ~ 


чѵ 


т. е. тем более 

/(*о + й) I _ Щ*о + /р[ 1 

их о) I 1 1 (* 0 ) і ^ ’ 

откуда следует 

|/(^0 + / 2 )|<|/ К ) 1 . 

что доказывает лемму Даламбера. 

При помощи той геометрической иллюстрации, которая была 
дана выше, можно следующим образом пояснить лемму Даламбера. 
Дано, что |/(Жо) | >0. Это значит, что длина перпендикуляра, вос- 
ставленного к комплексной плоскости в точке лг 0 , отлична от нуля. 
Тогда, по лемме Даламбера, можно найти такую точку + 

что |/(*і)І<|/(*о)|, т. е. перпендикуляр в точке х х будет более 
коротким, чем в точке х 0 , и, следовательно, поверхность, образо- 
ванная концами перпендикуляров, будет в этой новой точке не- 
сколько ближе к комплексной плоскости. Как показывает доказа- 
тельство леммы, модуль к можно считать сколь угодно малым, т. е. 
точку х х можно выбрать как угодно близко к точке х 0 ; мы не 
будем, однако, пользоваться в дальнейшем этим замечанием. 

Корнями многочлена /(х) будут служить, очевидно, те комплекс- 
ные числа (т. е. те точки комплексной плоскости), в которых по- 
верхность, образованная концами перпендикуляров, коснется этой 
плоскости. Опираясь лишь на лемму Даламбера, нельзя доказать 
существование таких точек, В самом деле, пользуясь этой леммой, 
можно найти такую бесконечную последовательность точек 
Хо, х 1г х 2 что 

!/(*о)|>і/К)і>|/(* 2 )|>.., (11) 

Отсюда не следует, однако, существование такой точки х, что /(д:) = 0, 
тем более, что убывающая последовательность положительных дей- 
ствительных чисел (11) вовсе не обязана стремиться к нулю. 

Дальнейшие рассмотрения будут основаны на одной теореме из 
теории функций комплексного переменного, обобщающей теорему 
Вейерштрасса, известную читателю из курса математического анализа. 
Она относится к действительным функциям комплексного перемен- 
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ного, т. е. к функциям комплексного переменного, принимающим 
лишь действительные значения; примером таких функций служит 
модуль многочлена. В формулировке этой теоремы мы будем говорить 
для простоты о замкнутом круге Е, понимая под этим круг на 
комплексной плоскости, к которому присоединены все точки его 
границы. 

Если действительная функция §{х) комплексного перемен- 
ного х непрерывна во всех точках замкнутого круга Е , то 
существует в круге Е такая точка х 0 , что для всех х из Е 
имеет место неравенство ^{х) ^ ^(х 0 ). Точка х 0 является , сле- 
довательно , точкой минимума для §(х) в круге Е. 

Доказательство этой теоремы можно найти во всех курсах тео- 
рии функций комплексного переменного, и мы его не приводим 

Ограничиваясь случаем, когда функция @(х) неотрицательна во 
всех точках круга Е , — только этот случай представляет для нас 
интерес, — поясним геометрически эту теорему при помощи той 
иллюстрации, которая уже использована выше. В каждой точке х в 
круга Е проводим перпендикуляр длины ^(лг 0 ). Концы этих пер- 
пендикуляров составляют кусок непрерывной кривой поверхности, 
причем благодаря замкнутости круга Е существование точек мини- 
мума для этого куска поверхности делается геометрически доста- 
точно ясным. Эта иллюстрация не заменяет, конечно, доказательства 
теоремы. 

Теперь мы можем перейти к непосредственному доказатель- 
ству основной теоремы. Пусть дан многочлен /(х) сте- 
пени п, п^= 1. Если его свободный член есть а п , то, очевидно, 
/(0) = а„. Применим к нашему многочлену лемму о возрастании 
модуля многочлена, полагая М= {/(О) | = | а п |. Существует, следо- 
вательно, такое ЛГ, что при [лг|>іѴ будет |/(л:) | > |/(0) |. Оче- 
видно, далее, что указанное выше обобщение теоремы Вейерштрасса 
применимо к функции \/{х) ) при любом выборе замкнутого круга Е. 
В качестве Е мы возьмем замкнутый круг, ограниченный окруж- 
ностью радиуса N с центром в точке 0. Пусть точка х 0 будет 
точкой минимума для \/{х)\ в круге Е, откуда, в частности, сле- 
дует |/(* 0 )|<|/(0)|. 

Легко видеть, что х й на самом деле будет служить точкой 
минимума для | / (лг) | на всей комплексной плоскости', если 
точка х' лежит вне Е , то | х' | >» Ы, и поэтому 

|/(*') 1 >|/( 0 )|>|/<*.)|. 

Отсюда следует, наконец, что /(л: 0 ) = 0, т. е. что х 0 служит кор- 
нем для /(дг); если бы было /(х 0 )фО, то, по лемме Даламбера, 
существовала бы такая точка х г , что \/{х 1 ) | <5|/(д: 0 ) І> эт0 П Р° ТИ * 
воречит, однако, только что установленному свойству точки х 0 . 

Заметим, что еще одно доказательство основной теоремы будет 
приведено в § 55. 
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§ 24. Следствия из основной теоремы 

Пусть дан многочлен л- й степени, л ^ 1, 

Я*! ) = й 0 .г" + а 1 д: п - 1 + . . . + а п _ г х-\-а п (1) 

с любыми комплексными коэффициентами. Мы снова рассматриваем 
его как формально-алгебраическое выражение, вполне определяемое 
набором своих коэффициентов. Основная теорема о существовании 
корня, доказанная в предшествующем параграфе, позволяет утвер- 
ждать существование для /( х ) корня а х , комплексного или действи- 
тельного. Поэтому многочлен /( х ) обладает разложением 

/(■*) = (■*— «і)ф(*). 

Коэффициенты многочлена ф (дс) снова являются действительными 
или комплексными числами, и поэтому ср(х) обладает корнем сс 2 , 
откуда 

/(х) — (х — а х ) (х — а 2 ) ф (х). 

Продолжая так далее, мы придем после конечного числа шагов 
к разложению многочлена л- й степени /(х) в произ- 
ведение л линейных множителей, 

/(х)-а 0 (х— а х )(х—щ) ... (х-а п ). (2) 

Коэффициент а 0 появился по следующей причине: если бы справа 
в выражении (2) стоял некоторый коэффициент Ь , то после раскры- 
тия скобок старший член многочлена /( х ) имел бы вид Ьх п , хотя 
на самом деле, ввиду (1), им является член а^. Поэтому Ь = а 0 . 

Разложение (2) является для многочлена /(х) единственным 
с точностью до порядка сомножителей разложением такого 
типа. 

Пусть, в самом деле, имеется еще разложение 

Я*) = в 0 (* — рі)(*— Рг) ••• (-Ж — р ж ). (3) 

Из (2) и (3) следует равенство 

(х—а х )(х—а 2 ) ••• (*—«») = (*— Рі)(*—Рг) ••• (■« — Р„). (4) 

Если бы корень а,- был отличен от всех (3 ; -, /=1, 2, ..., л, то, 
подставляя а і вместо неизвестного в (4), мы получили бы слеза 
нуль, а справа число, отличное от нуля. Таким образом, всякий 
корень а,- равен некоторому корню |3 ; - и обратно. 

Отсюда еще не вытекает совпадение разложений (2) и (3). Дей- 
ствительно, среди корней а,-, і=1, 2, ..., л, могут быть равные 
между собой. Пусть, например, я этих корней равны а, и пусть, 
с другой стороны, среди корней у = 1 , 2, ..., л, содержится і 
равных корню а х . Нужно показать, что я ={. 
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Так как степень произведения многочленов равна сумме степеней 
сомножителей, то произведение двух многочленов, отличных от нуля, 
не может равняться нулю. Отсюда вытекает, что если два произ- 
ведения многочленов равны друг другу, то обе части равенства 
можно сократить на общий множитель : если 

/(х)(р(х) = #(х)ср(х) 

и ф(д:)^=0, то из 

[/(■*) — <?(■*)] Ф (*) = 0 

следует 

/(•*) — *(■*) = О, 

т. е. 

/(х) = #(х). 

Применим это к равенству (4). Если, например, то, сокра- 

щая обе части равенства (4) на множитель (х — а 1 ) і , мы придем 
к равенству, левая часть которого еще содержит множитель х — о^, 
а правая его не содержит. Выше показано, однако, что это при- 
водит к противоречию. Таким образом, единственность разложения (2) 
для многочлена /(х) доказана. 

Объединяя вместе одинаковые множители, разложение (2) можно 
переписать в виде 

/(х) = а 0 (х — а 1 ) к >(х — а г ) к * ... ( х—а (5) 
где 

^1 +.&2 4 " • • • 4 = п - 

При этом предполагается, что среди корней й 1 , а 2 , . .., с х, уже 
нет равных. 

Докажем, что число к і из (5), і = 1, 2, является крат- 

ностью корня а і в многочлене /(х). Действительно, если эта 
кратность равна то ^ Пусть, однако, В силу опре- 

деления кратности корня для /(х) существует разложение 

/( х ) = (х — а,-) 5 * ф {х). 

Заменяя в этом разложении множитель ф (л:) его разложением на 
линейные множители, мы получили бы для /{х) разложение на 
линейные множители, заведомо отличное от разложения (2), т. е. 
пришли бы к противоречию с доказанной выше единственностью 
этого разложения. 

Мы доказали, таким образом, следующий важный результат: 

Всякий многочлен /(х) степени п, 1, с любыми число- 
выми коэффициентами имеет п корней , если каждый из корней 
считать столько раз, какова его кратность. 

Заметим, что наша теорема справедлива и при п — 0, так как 
многочлен нулевой степени не имеет, понятно, корней. Эта теорема 
неприменима лишь к многочлену 0, не имеющему степени и равному 
нулю при любом значении х. Этим последним замечанием мы вос- 
пользуемся при доказательстве следующей теоремы: 
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Если многочлены /( х ) и @(х), степени которых не превос- 
ходят л, имеют равные значения более чем при п различных 
значениях неизвестного , то /(х) = §(х). 

Действительно, многочлен /(х) — §(х) имеет при наших пред- 
положениях более чем п корней, а так как его степень не превос- 
ходит п, то должно иметь место равенство /(л:) — ^(л:) = 0. 

Таким образом, учитывая, что различных чисел бесконечно много, 
можно утверждать, что для любых двух различных многочленов /(х) 
и ^(л:) найдутся такие значения с неизвестного х, что /{с)ф§(с). 
Такие с можно найти не только среди комплексных чисел, но 
и среди действительных, среди рациональных и даже среди целых 
чисел. 

Таким образом, два многочлена с числовыми коэф- 
фициентами, имеющие хотя бы при одной степени 
неизвестного х различные коэффициенты, будут 
различными комплексными функциями комплекс- 
ного переменногол:. Этим доказана, наконец, равносильность 
для многочленов с числовыми коэффициентами двух указанных 
в § 20 определений равенства многочленов — алгебраического и 
теоретико-функционального . 

Теорема, доказанная выше, позволяет утверждать, что много- 
член, степень которого не больше п , вполне определяется своими 
значениями при любых различных значениях неизвестного, число 
которых больше п. Можно ли эти значения многочлена задавать 
произвольно? Если предположить, что задаются значения многочлена 
при п 4-1 различных значениях неизвестного, то ответ будет положи- 
тельным: всегда существует многочлен не более чем п-й степени , 
принимающий наперед заданные значения при я + 1 'заданных 
различных значениях неизвестного. 

В самом деле, пусть нужно построить многочлен не более чем 
л-й степени, который при значениях неизвестного а х , а 2 , ..., а п+1 , 
предполагаемых различными, принимает соответственно значения 
е ѵ с 2 , ..., с п+1 . Этим многочленом будет: 

п + 1 

Р( Г \— V Сі (х—щ) ... (х—сц-д (х—а і+1 ) ... (х—а п+1 ) 

У ~ К — «і) ( а / — а і—і)( а і — а і+і) •** (°і — а в+і) * ' 

Действительно, его степень не больше я, а значение /(а,) равно с { . 

Формула (6) называется интерполяционной формулой Лагранжа. 
Название «интерполяционная» связано с тем, что по этой формуле, 
зная значения многочлена в я-}-1 точке, можно вычислять его зна- 
чения во всех других точках. 

Формулы Вьета. Пусть дан многочлен /( х ) степени я со старшим 
коэффициентом 1, 

/(х) = х п а^"- 1 а г х п ~ 2 . . . +а п _ х х + а п , 


(?) 



§ 24] следствия из основной теоремы 15Э 

и пусть а 1 , а 3 , а„— его корни 1 ). Тогда /( х ) обладает следую- 

щим разложением: 

/(х) = (х—а 1 ) (х — а 2 ) . . . (х — а„). 

Перемножая скобки, стоящие справа, а затем приводя подобные члены 
и сравнивая полученные коэффициенты с коэффициентами из (7), мы 
получим следующие равенства, называемые формулами Вьета и 
выражающие коэффициенты многочлена через его корни: 

а 1 — (®1 4 ~ а 2 + • • • + 

а 2 = а х а. 2 + а г а 3 + . . . + а г а п + а 2 а 3 + . . . + а я _ г «„, 

<4 = — (а 1 а 2 а 3 + а 1 а 2 а 4 + . . . + а„_ 2 а и _ 1 а„), 


К - 1 = ( — 1 ) п 1 («і« 2 • • • і + «і« г • • • “ п - 2 а„ + • • • + а 2 а 3 . . .а„), 

«» = ( — 

Таким образом, в правой части к - го равенства, к— 1, 2,..., л, 
стоит сумма всевозможных произведений по к корней, взятая со 
знаком плюс или минус, в зависимости от четности или нечетности к. 

При л — 2 эти формулы превращаются в известную из элемен- 
тарной алгебры связь между корнями и коэффициентами квадратного 
многочлена. При п — 3, т. е. для кубичного многочлена, эти формулы 
принимают вид 

= (®і 4“ ®2 "Т” ®з)> + — + + +; -| И 2 И 3 , П 3 — 

Формулы Вьета облегчают написание многочлена по заданным его корням. 
Так, найдем многочлен / (х) четвертой степени, имеющий простыми корнями 
числа 5 и — 2 и двукратным корнем число 3. Мы получим: 

0і = — (5 — 2 + 3 + 3) = — 9, 

а 2 = 5-( — 2) + 5'3+5-3+( — 2)-3 + ( — 2)- 3+3-3= 17, 
а 3 = — [5-( — 2)-3+5-( — 2)'3+5-3-3 + ( — 2)- 3-3] = 33, 
а,=5-( — 2)- 3-3= — 90, 

а поэтому 

( ( А-) = X* — 9к 3 + 1 7х 2 + 33* — 90. 

Если старший коэффициент а 0 многочлена /( х ) отличен от 1, 
то для применения формул Вьета необходимо сначала разделить все 
Коэффициенты на а 0 , что не влияет на корни многочлена. Таким 
образом, в этом случае формулы Вьета дают выражение для отно- 
шений всех коэффициентов к старшему. 

Многочлены с действительными коэффициентами. Сейчас будут 
выведены некоторые следствия из основной теоремы алгебры ком- 
плексных чисел, относящиеся к многочленам с действительными 


•) Каждый кратный корень взят здесь соответствующее число раз. 
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коэффициентами. По существу, именно на этих следствиях основано 
то исключительно большое значение основной теоремы, о котором 
говорилось раньше. 

Пусть многочлен с действительными коэффициентами 
/{х) — а 0 х п -\-а х х п ~ 1 + . . . +а п _ 1 х + а п 
имеет комплексный корень а, т. е. 

Досс п -{- а 1 а п -1 + . . . -ф а п _ х а-|-а п = 0. 

Мы знаем, что последнее равенство не нарушится, если в нем все 
числа заменить на сопряженные. Однако все коэффициенты а 0 , а х , . . . 
..., а п -і > а п> а также число 0, стоящее справа, будучи действи- 
тельными, останутся при этой замене без изменения, и мы приходим 
к равенству 

а<& п -ф «і а п_1 + . . . +а п _ 1 а -ф а п = 0, 

т. е. 

/ (а) = 0 . 

Таким образом, если комплексное (но не действительное) число а 
служит корнем многочлена /(х) с действительными коэффициен- 
тами, то корнем для /(х) будет и сопряженное число а. 

Многочлен /(х) будет делиться, следовательно, на квадратный 
трехчлен 

<р(;е) = (лг — ос) (лг — а)—х 2 — (ос -ф ос) х -ф оса, (8) 

коэффициенты которого, как мы знаем из § 18, действительны. 
Пользуясь этим, докажем, что корни ос и а имеют в многочлене / (лг) 
одну и ту же кратность. 

Пусть, в самом деле, эти корни имеют соответственно крат- 
ности к и / и пусть, например, к~у>1. Тогда /(х) делится на 
/-ю степень многочлена <р (*), 

/(л:)=Ѵ(л:)0(л:). 

Многочлен д (х), как частное двух многочленов с действительными 
коэффициентами, также имеет действительные коэффициенты, но, 
в противоречие с доказанным выше, он имеет число а своим (к — /)-крат- 
ным корнем, тогда как число а не является для него корнем. Отсюда 
следует, что к = 1. 

Таким образом, теперь можно сказать, что комплексные корни 
всякого многочлена с действительными коэффициентами попарно 
сопряжены. Отсюда и из доказанной выше единственности разло- 
жений вида (2) вытекает следующий окончательный результат: 

Всякий многочлен /( х ) с действительными коэффициентами 
представим, притом единственным способом ( с точностью до 
порядка множителей ), в виде произведения своего старшего коэф- 
фициента а 0 и нескольких многочленов с действительными коэф- 



РАЦИОНАЛЬНЫЕ ДРОБИ 


161 


§ 251 

фициентами, линейных вида х — а, соответствующих его дей- 
ствительным корням , и квадратных вида (8), соответствующих 
парам сопряженных комплексных корней. 

Для дальнейшего полезно подчеркнуть, что среди многочленов 
с действительными коэффициентами и со старшим коэффициентом 1, 
неразложимыми на множители меньшей степени или, как мы будем 
говорить, неприводимыми, являются лишь линейные многочлены 
вида х — а и квадратные многочлены вида (8). 


§ 25*. Рациональные дроби 


В курсе математического анализа изучаются, помимо целых 
рациональных функций, названных нами многочленами, также дробно- 

/ (х~) 

рациональные функции ; это будут частные двух целых рацио- 


нальных функций, где §(х)фО. Над этими функциями производятся 
алгебраические операции по таким же законам, как над рациональ- 
ными числами, т. е. как над дробями с целыми числителями и зна- 
менателями. Равенство двух дробно-рациональных функций или, как 
мы будем дальше говорить, рациональных дробей также понимается 
в том же смысле, что и равенство дробей в элементарной арифме- 
тике. Для определенности мы будем рассматривать рациональные 
дроби с действительными коэффициентами; читатель без труда 
заметит, что все содержание настоящего параграфа может быть 
почти дословно перенесено на случай рациональных дробей с ком- 
плексными коэффициентами. 

Рациональная дробь называется несократимой, если ее числитель 
взаимно прост со знаменателем. 

Всякая рациональная дробь равна некоторой несократимой 
дроби, определяемой однозначно с точностью до множителя 
нулевой степени, общего для числителя и знаменателя. 

Действительно, всякую рациональную дробь можно сократить на 
наибольший общий делитель ее числителя и знаменателя, после чего 
будет получена равная ей несократимая дробь. Если, далее, равны 

, / (х) го (х) 

друг другу несократимые дроби ~~ и ~~ , т. е. 


/(•*) Ф С*) = ^ ( х ) ф ( х ), (!) 


то из взаимной простоты /(х) и §(х) следует, по свойству б) из 
§ 21, что ф (х) делится на /(х), а из взаимной простоты ф (х) и ф(х) 
следует, что /(х) делится на ф(х). Таким образом, /(х) = ар(х), 
а тогда из (1) следует §'(х) = сф(х). 

Рациональная дробь называется правильной , если степень числи- 
теля меньше степени знаменателя. Если к числу правильных дробей 
мы условимся причислять многочлен 0, то справедлива следующая 
теорема: 
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Всякая рациональная дробь представима, притом единствен- 
ным способом, в виде суммы многочлена и правильной дроби. 

г І Х ) 

Действительно, если дана рациональная дробь и если, деля 
числитель на знаменатель, мы получим равенство 
/(х) = §(х)ч(х)-\-г{х), 

где степень г(х) меньше степени ^(,ѵ), то, как легко проверить, 

т- а(Х )4- г -ы 

8(х)~ Ч( )+ 8(*) • 

Если имеет место также равенство 


Ш 

8{х) 




Ф(*) * 


где степень ф ( х ) меньше степени ф (лт), то мы получаем равенство 


<}(х)—я(х) 


ф (х) г (X) 

Ф (*) 8 (*) 


ф (*)§(*) — ф (х) г (х) 
Ф (х)ё(х) 


Так как слева стоит многочлен, а справа, как легко видеть, правиль 
ная дробь, то мы получим у (х) — у(х) — 0 и 


Ф (*) г (х) _ 0 

Ф (■*) 8 (■*) 


Правильные рациональные дроби могут быть подвергнуты даль- 
нейшему изучению. При этом напомним, что, как отмечено в конце 
предшествующего параграфа, неприводимыми действительными много- 
членами являются многочлены вида х — а, где число а действитель- 
ное, и многочлены вида х 2 — ((3-)-(5) х + (5(5, где (5 и |3 — пара со- 
пряженных комплексных чисел. Как легко проверить, в комплексном 
случае аналогичную роль играют многочлены вида х — а, где а — 
любое комплексное число. 


Г (х) 

Правильная рациональная дробь — ^ называется простейшей, 

если ее знаменатель §(х) является степенью^ неприводимого много- 
члена р(х ), 

ё(х) = р к (х), к^\, 


а степень числителя /(х) меньше степени р (дг). 

Справедлива следующая основная теорема: 

Всякая правильная рациональная дробь разлагается в сумму 
простейших дробей. 

Доказательство. Рассмотрим сначала правильную рацнональ- 

( ( х ) 

ную дробь — , где многочлены $(х) и Н(х) взаимно просты, 

8 \Х) И (х) 


(?(*). *(■*))=!• 
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Существуют, следовательно, ввиду § 21, такие многочлены и(х)я 
ѵ(х), что 

і (*) и(х) + н ( х ) ѵ(х)=\. 

Отсюда 

В (х) (л) / {*)] + к (х) [ѵ (х) / (л:)] = / (х). (2) 


Пусть, деля произведение и(х)/(х) на к (х), мы получим остаток 
и (.г), степень которого меньше степени к( х). Тогда равенство (2) 
можно будет переписать в виде 

В (х) и(х)-\-к (х) ѵ (х) =/(х), (3) 


где ѵ {х) — многочлен, выражение которого могло бы быть без труда 
написано. Так как степень произведения §-(х)и(х) меньше степени 
произведения @(х)к(х) и это же, по условию, верно для много- 
члена /(х), то и произведение к(х)ѵ(х) имеет степень меньшую, 
чем § (х) к (х), а поэтому степень ѵ (х) меньше степени ^(х). Из (3) 
вытекает теперь равенство 


Пх) 


ѵ (х) и (х) 


а (X) к (X) В (х) ■ к ( X ) ’ 

в правой части которого стоит сумма правильных дробей. 

Если хотя бы один из знаменателей ^(х), к(х) разлагается 
в произведение взаимно простых множителей, то можно выполнить 
дальнейшее разложение. Продолжая так далее, мы получим, что 
всякая правильная дробь разлагается в сумму нескольких пра- 
вильных дробей, каждая из которых имеет знаменателем сте- 
пень некоторого неприводимого многочлена. Точнее, если дана 

Ш 

8(х) ’ 

множители 


правильная дробь 
на неприводимые 


знаменатель которой имеет разложение 


§{х)^ р ^{х)р к г (х)... рЧчх) 


(всегда можно считать, конечно, что старший коэффициент знаме- 
нателя рациональной дроби равен единице), причем (х) ф Р] (я) 
при і Ф у, то 

Их) _ «і (*) , и 2 (х) д_ щ (х) , 

8 (х) р\ 1 {х) ‘ р\Чх) ' " ' ' р\‘ (х) ’ 


все слагаемые в правой части этого равенства являются правил: - 
ними дробями. 

Нам остается рассмотреть правильную дробь вида . где 

р(х) — неприводимый многочлен. Применяя алгоритм деления е ос- 
татком, разделим и(х) на р к ~ г (х), полученный остаток разделим 
на р к -Цх) и т. д. 
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Мы придем к следующим равенствам: 

и (х) = р к ~ 1 (х) $1 (х) + иі {х), 
иі (х) = р к ~ 2 (х) $ 2 {х) + « 2 (х), 


«А - 2 {X) = р ( х ) і (х) + и к _ , (х). 

Так как при этом степень и(х), по условию, меньше степени р к {х), 
а степень каждого из остатков вДх), і = 1, 2, к — 1, меньше 

степени соответствующего делителя р к ~‘ (х), то степени всех частных 
$і(х), $ 2 (х), ••• і 5 а-і(х) будут строго меньше степени многочлена 
р (х). Степень последнего остатка и к _ * (х) также меньше степени р (х). 
Из полученных равенств следует: 

и (х) = р к ~ 1 (X) (X) -\-р к ~ 2 (X) 5 г (X) -)- . . . + р (х) (х) + (х). 

Отсюда мы приходим к искомому представлению рациональной 

дроби -41-г в виде суммы простейших дробей; 

Р \Х) 

и(х) _ и к к (х) 5а -і(*) , , % ( х ) , (х) 

р к (х) р к (х) ‘ р® 1 (*/ ' ' ‘ ‘ р* (х) р (х) * 

Основная теорема доказана. Ее можно дополнить следующей 
теоремой единственности: 

Всякая правильная рациональная дробь обладает единствен- 
ным разложением в сумму простейших дробей. 

Пусть, в самом деле, некоторая правильная дробь может быть 
двумя способами представлена в виде суммы простейших дробей. 
Вычитая одно из этих представлений из другого и приводя подоб- 
ные члены, мы получим сумму простейших дробей, тождественно 
равную нулю. Пусть знаменатели простейших дробей, составляющих 
эту сумму, будут некоторыми степенями различных неприводимых 
многочленов рі(х), /э 2 (х), ..., р,(х) и пусть наивысшая степень 
многочлена р ( (х), і—і, 2, $, являющаяся одним из этих зна- 

менателей, будет р к * (х). Умножим обе части рассматриваемого ра- 
венства на произведение Рі'~ 1 (х)р1 2 (х) ...р$‘(х). Все слагаемые 
нашей суммы, кроме одного, превратятся при этом в многочлены. 

Что же касается слагаемого . и .^ то оно превратится в дробь, 

РѴ (х) 

знаменателем которой служит рі(х), а числителем — произведение 
и (х) р кг (х) ... р к * (х). Числитель не делится нацело на знаменатель, 
так как многочлен рі (х) неприводим, а все множители числителя 
с ним взаимно просты. Выполняя деление с остатком, мы в резуль- 
тате получим, что равна нулю сумма многочлена и отличной от 
нуля правильной дроби, что, однако, невозможно. 
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Пример. Разложить в сумму простейших дробей действительную пра- 
, / (х) 

внльную дробь , где 


/ (х) = 2х* — ІО* 3 + 7х 2 + Ах + 3, 
ё(х)—х й — 2х 3 + 2х 2 — Зх + 2. 


Легко проверяется, что 

§(*) = (* + 2)(*-1) 2 (* 2 +1), 

причем каждый из многочленов х-\-2, х — 1, * 2 -|-1 неприводим. Из изло- 
женной выше теории вытекает, что искомое разложение должно иметь вид 


/(*) А В С Рх + Е 

§ (х) * + 2 ^(х— 1) 2І_ *— 1 ^ х 2 +1 * 


(4) 


где числа А, В, С, И и Е еще должны быть разысканы. 

Из (4) вытекает равенство 

/ (*) = А ( * - I) 2 ( * 2 + 1) + 5 (* + 2) (х 2 + 1) + С (* + 2) (*- 1) (* 2 + 1) + 

+ Бх (х + 2) (а- - 1 ) 2 + Е (х + 2) (х - 1 ) 2 . (5) 

Приравнивая коэффициенты при одинаковых степенях неизвестного х из 
обеих частей равенства (5), мы получили бы систему пяти линейных урав- 
нений относительно пяти неизвестных А, В, С, И, Е, причем, как вытекает 
из доказанного выше, эта система обладает решением и притом единствен- 
ным. Мы пойдем, однако, иным путем. 

Полагая в равенстве (5) х = — 2, мы придем к равенству 45Л = 135, 
откуда 

Л= 3. (6) 


Полагая, далее, в (5) х»=1, мы получим 6В = 6, т. е. 

5 = 1. (7) 

После этого положим в равенстве (5) последовательно х = 0 и х~ — 1. 
Используя (6) и (7), мы получим уравнения 


Отсюда 


— 2С + 2Е = — 2, \ 
— АС — 4П + 4Е = — 8. / 

0 = 1 . 


( 8 ) 

(9) 


Положим, наконец, в равенстве (5) х — 2, Используя (6), (7) и (9), мы при- 
дем к уравнению 


20С+4Е= — 52, 


которое вместе с первым из уравнений (8) дает 

С = — 2, Е — — 3. 

Таким образом, 

/(*) 3,1 2 х — 3 

§(х) * + 2 Ч*-І) 2 *-1 + л- 2 т-1 ‘ 



ГЛАВА ШЕСТАЯ 

КВАДРАТИЧНЫЕ ФОРМЫ 


§ 26. Приведение квадратичной формы к каноническому виду 

Истоки теории квадратичных форм лежат в аналитической гео- 
метрии, а именно в теории кривых (и поверхностей) второго порядка. 
Известно, что уравнение центральной кривой' второго порядка на 
плоскости, после перенесения начала прямоугольных координат 
в центр этой кривой, имеет вид 

Ах* + 2Вху + Су 2 = 0. (1) 

Известно, далее, что можно совершить такой поворот осей коорди- 
нат на некоторый угол а, т. е. такой переход от координат х, у 
к координатам х', у': 

х — х' созсс — у' зіпа, 
у—х' 5іп а-\-у г соза, 

что в новых координатах уравнение нашей кривой будет иметь 
«канонический» вид 

АѴЧС'у' г =0; (3) 

в этом уравнении коэффициент при произведении неизвестных х'у' 
равен, следовательно, нулю. Преобразование координат (2) можно 
толковать, очевидно, как линейное преобразование неизвестных 
(см. § 13), притом невырожденное, так как определитель из его 
коэффициентов равен единице. Это преобразование применяется к ле- 
вой части уравнения (1), и поэтому можно сказать, что левая часть 
уравнения (1) невырожденным линейным преобразованием (2) превра- 
щается в левую часть уравнения (3). 

Многочисленные приложения потребовали построения аналогичной 
теории для случая, когда число неизвестных вместо двух равно 
любому я, а коэффициенты являются или действительными, или же 
любыми комплексными числами. 

Обобщая выражение, стоящее в левой части уравнения (1), мы 
приходим к следующему понятию. 
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Квадратичной формой / от п неизвестных х г , . , , , х п 
называется сумма, каждый член которой является или квадратом 
одного из этих неизвестных, или произведением двух разных неиз- 
вестных. Квадратичная форма называется действительной или ком- 
плексной в зависимости от того, являются ли ее коэффициенты 
действительными или же могут быть любыми комплексными числами. 

Считая, что в квадратичной форме / уже сделано приведение 
подобных членов, введем следующие обозначения для коэффициентов 
этой формы: коэффициент при х* обозначим через а, :і , а коэффи- 
циент при произведении х ; Х/ для і ф у — через 2 а і} - (сравнить с (1)!). 
Так как, однако, х і х } — х і х і , то коэффициент при этом произведе- 
нии мог бы быть обозначен и через 2а, 7 , т. е. введенные нами обо- 
значения предполагают справедливость равенства 

а п= а и- ^ 

Член 2 а і ,х і х ] - можно записать теперь в виде 
2ауХ[Х ] = а и х і х / + а п х } х ь 

а всю квадратичную форму / — в виде суммы всевозможных членов 
а і ]Х і х і , где і и у уже независимо друг от друга принимают значе- 
ния от 1 до я: 

/=2 2 а и х і х Р і 5 ) 

І = 1 1 = 1 

в частности, при і = у получается член а н .ѵ*. 

Из коэффициентов ац можно составить, очевидно, квадратную 
матрицу А = (а ( у) порядка я; она называется матрицей квадращич- 
ной формы /, а ее ранг г — рангом этой квадратичной формы. Если, 
в частности, г=я, т. е. матрица — невырожденная, то и квадратич- 
ная форма / называется невырожденной. Ввиду равенства (4) эле- 
менты матрицы А, симметричные относительно главной диагонали, 
равны между собой, т. е. матрица А — симметрическая. Обратно, 
для любой симметрической матрицы А п- го порядка можно указать 
вполне определенную квадратичную форму (5) от п неизвестных, 
имеющую элементы матрицы А своими коэффициентами. 

Квадратичную форму (5) можно записать в ином виде, используя 
введенное в § 14 умножение прямоугольных матриц. Условимся 
сначала о следующем обозначении: если дана квадратная или вообще 
прямоугольная матрица А, то через А' будет обозначаться матрица, 
полученная из матрицы А транспонированием. Если матрицы А и В 
таковы, что их произведение определено, то имеет место равенство: 

{АВ)' — В' А', (6) 

т. е. матрица, полученная транспонированием произведения, равна 
произведению матриц, получающихся транспонированием сомно- 
жителей, притом взятых в обратном порядке. 
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В самом деле, если произведение АВ определено, то будет опре- 
делено, как легко проверить, и произведение В' А': число столбцов 
матрицы В' равно числу строк матрицы А'. Элемент матрицы (АВ)' , 
стоящий в ее і-й строке и у'-м столбце, в матрице АВ расположен 
в у-й строке и /-м столбце. Он равен поэтому сумме произведений 
соответственных элементов у-й строки матрицы А и г-го столбца 
матрицы В, т. е. равен сумме произведений соответственных эле- 
ментов у-го столбца матрицы А' и і- й строки матрицы В’. Этим 
равенство (6) доказано. 

Заметим, что матрица А тогда и только тогда будет сим- 
метрической, если она совпадает со своей транспонированной, 
т. е. если 

А' = А. 

Обозначим теперь через X столбец, составленный из неизвестных, 



X является матрицей, имеющей п строк и один столбец. Транспо- 
нируя эту матрицу, получим матрицу 

Х' = (х и х 2 , ... , х„), 
составленную из одной строки. 

Квадратичная форма (5) с матрицей А-(а^) может быть запи- 
сана теперь в виде следующего произведения: 

/=Л "АХ. (7) 

Действительно, произведение АХ будет матрицей, состоящей из 
одного столбца: 

’ 2 «.л 
1=1 
П 


( Хл “»»/*/ ^ 

Умножая эту матрицу слева на матрицу Л", мы получим «матрицу», 
состоящую из одной строки и одного столбца, а именно правую часть 
равенства (5). 
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Что произойдет с квадратичной формой /, если входящие в нее 
неизвестные х и х 2 , . . . , х п будут подвергнуты линейному преобра- 
зованию 

П 

2 ЧікУь « = 2 . ( 8 ) 

к = 1 

с матрицей ($—(д ік )1 Будем считать при этом, что если форма / 
действительная, то и элементы матрицы <2 должны быть действитель- 
ными. Обозначая через У столбец из неизвестных у и у 2 , у п , 
запишем линейное преобразование (8) в виде матричного равенства: 


* 

Отсюда по (6) 

X' 


<2 Г. 

(9) 

Г<2'. 

(10) 


Подставляя (9) и (10) в запись (7) формы /, получаем: 

/= У (<?МО) Г, 

или 

/= У'ВУ, 

где 

В = <2'л<2. 

Матрица В будет симметрической, так как ввиду равенства (6), 
справедливого, очевидно, для любого числа множителей, и равенства 
Л' = Л, равносильного симметричности матрицы А, имеем: 

В' =С1'А'<Э = <Э'А(1^В. 

Таким образом, доказана следующая теорема: 

Квадратичная форма от п неизвестных, имеющая матрицу А,- 
после выполнения линейного преобразования неизвестных с матри- 
цей превращается в квадратичную форму от новых неизвест- 
ных, причем матрицей этой формы служит произведение 0,'А(}. 

Предположим теперь, что мы выполняем невырожденное 
линейное преобразование, т. е. (3, а поэтому и <3' — матрицы невы- 
рожденные. Произведение С?'А(2 получается в этом случае умноже- 
нием матрицы А на невырожденные матрицы и поэтому, как сле- 
дует из результатов § 14, ранг этого произведения равен рангу 
матрицы А. Таким образом, ранг квадратичной формы не меняется 
при выполнении невырожденного линейного преобразования. 

Рассмотрим теперь, по аналогии с указанной в начале параграфа 
геометрической задачей приведения уравнения центральной кривой 
второго порядка к каноническому виду (3), вопрос о приведении 
произвольной квадратичной формы некоторым невырожденным ли- 
нейным преобразованием к виду суммы квадратов неизвестных, 
т. е. к такому виду, когда все коэффициенты при произведениях 
различных неизвестных равны нулю; этот специальный вид квадра- 
тичной формы называется каноническим. Предположим сначала, чтс 



170 


КВАДРАТИЧНЫЕ ФОРМЫ 


[гл. 6 


квадратичная форма / от п неизвестных х іу х 2 , , , . , х п уже при- 
ведена невырожденным линейным преобразованием к каноническому 
виду 

/— ■+■ Ь 2 уІ + . . . + Ь п Уп, ( 11 ) 

где У и У2, . . . , у „ — новые неизвестные. Некоторые из коэффициен- 
тов Ь 1( Ь 2 , .... Ъ п могут, конечно, быть нулями. Докажем, что число 
отличных от нуля коэффициентов в (11) непременно равно рангу г 
формы /. 

В самом деле, так как мы пришли к (11) при помощи невыро- 
жденного преобразования, то квадратичная форма, стоящая в правой 
части равенства (11), также должна быть ранга г. Однако матрица 
этой квадратичной формы имеет диагональный вид 



и требование, чтобы эта матрица имела ранг г, равносильно пред- 
положению, что на ее главной диагонали стоит ровно г отличных 
от нуля элементов. 

Перейдем к доказательству следующей основной теоремы 
о квадратичных формах. 

Всякая квадратичная форма может быть приведена некото- 
рым невырожденным линейным преобразованием к каноническому 
виду. Если при этом рассматривается действительная квадра- 
тичная форма, то все коэффициенты указанного линейного пре- 
образования можно считать действительными. 

Эта теорема верна для случая квадратичных форм от одного 
неизвестного, так как всякая такая форма имеет вид ах 2 , являющийся 
каноническим. Мы можем, следовательно, вести доказательство ин- 
дукцией по числу неизвестных, т. е. доказывать теорему для квадра- 
тичных форм от п неизвестных, считая ее уже доказанной для форм 
с меньшим числом неизвестных. 

Пусть дана квадратичная форма 

П П 

/=Ш1 а и х і х / и 2) 

»'= 1 /= 1 

от п неизвестных Хі, х 2 , . , . , х п . Мы постараемся найти такое 
невырожденное линейное преобразование, которое выделило бы из / 
квадрат одного из неизвестных, т. е. привело бы / к виду суммы 
этого квадрата и некоторой квадратичной формы от остальных 
неизвестных. Эта цель легко достигается в том случае, если среди 
коэффициентов а іи а 22 , ..., а пп , стоящих в матрице формы /на 
главной диагонали, есть отличные от нуля, т. е. если в (12) входит 
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с отличным от нуля коэффициентом квадрат хотя бы одного из 
неизвестных х с . 

Пусть, например, ацф 0. Тогда, как легко проверить, выраже- 
ние а^і 1 («и^і + « 12*2 + • • • +«іЛ) 2 . являющееся квадратичной фор- 
мой, содержит такие же члены с неизвестным Хі, как и наша форма /, 
а поэтому разность 

/ — а іі (оцХі + + . . . + аі п х п ) 2 — & 

будет квадратичной формой, содержащей лишь неизвестные лг 2 , . . . ,х п , 
но не Хі. Отсюда 

/= а 11 (« 11-*1 + « 12*2 + . • • + а і п х п) 2 

Если мы введем обозначения 

Уі = а п Хі + а і2 х 2 + . . . +аіЛ, Уі = х і П Р И * = 2 , 3 > 

(13) 

то получим 

/ =а іі Уі +.§■» (14) 

где убудет теперь квадратичной формой от неизвестных^,)^, . 
Выражение (14) есть искомое выражение для формы /, так как оно 
получено из (12) невырожденным линейным преобразованием, а именно 
преобразованием, обратным линейному преобразованию (13), которое 
имеет своим определителем ап и поэтому не вырождено. 

Если же имеют место равенства а и — а 2 2 = . . . = а пп =0, то 
предварительно нужно совершить вспомогательное линейное пре- 
образование, приводящее к появлению в нашей форме / квадратов 
неизвестных. Так как среди коэффициентов в записи (12) этой формы 
должны быть отличные от нуля, — иначе нечего было бы доказы- 
вать, — то пусть, например, аі 2 += 0 , т. е. / является суммой члена 
2 а 12 АГі.Х 2 и членов, в каждый из которых входит хотя бы одно из 
неизвестных х 3 , . . . , х п . 

Совершим теперь линейное преобразование 

х 1 = г 1 — г 2 , х 2 = г 1 фг 2 , х і ~г 1 при і — 3, .... п. (15) 

Оно будет невырожденным, так как имеет определитель 


1 

— 1 

0 ... 

0 

1 

1 

0 ... 

0 

0 

0 

1 ... 

0 

0 

0 

0 ... 

1 


В результате этого преобразования член 2а 1і х 1 х ъ нашей формы 
примет вид 

2а іг х^х 2 = 2 (с^ 1 2 2 ) [%х + ^ 2 ) — 2 «і 2 + 2 «іг+’ 
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т. е. в форме / появятся, с отличными от нуля коэффициентами, 
квадраты сразу двух неизвестных, причем они не могут сократиться 
ни с одним из остальных членов, так как в каждый из этих последних 
входит хотя бы одно из неизвестных г$, . . . , г п . Теперь мы нахо- 
димся в условиях уже рассмотренного выше случая, т. е. еще одним 
невырожденным линейным преобразованием можем привести форму / 
к виду (14). 

Для окончания доказательства остается отметить, что квадратич- 
ная форма зависит от меньшего, чем /г, числа неизвестных и 
поэтому, по предположению индукции, некоторым невырожденным 
преобразованием неизвестных у 2 , у 3 , . . . , у п приводится к канони- 
ческому виду. Это преобразование, рассматриваемое как (невырож- 
денное, как легко видеть) преобразование всех п неизвестных, при 
котором у х остается без изменения, приводит, следовательно, (14) 
к каноническому виду. Таким образом, квадратичная форма /двумя 
или тремя невырожденными линейными преобразованиями, которые 
можно заменить одним невырожденным преобразованием — их произ- 
ведением, приводится к виду суммы квадратов неизвестных с неко- 
торыми коэффициентами. Число этих квадратов равно, как мы знаем, 
рангу формы г. Если, сверх того, квадратичная форма / действи- 
тельная, то коэффициенты как в каноническом виде формы /, так 
и в линейном преобразовании, приводящем / к этому виду, будут 
действительными; в самом деле, и линейное преобразование, обрат- 
ное (13), и линейное преобразование (15) имеют действительные 
коэффициенты. 

Доказательство основной теоремы закончено. Метод, использо- 
ванный в этом доказательстве, может быть применен в конкретных 
примерах для действительного приведения квадратичной формы 
к каноническому виду. Нужно лишь вместо индукции, которую мы 
использовали в доказательстве, последовательно выделять изложен- 
ным выше методом квадраты неизвестных. 

Пример. Привести к каноническому виду квадратичную форму 

?=2х 1 х і —6х 2 х 3 + 2х 3 х 1 . ( 16 ) 

Ввиду отсутствия в этой форме квадратов неизвестных мы выполним 
сначала невырожденное линейное преобразование 

■Ч*=Уі—Уг’ Н , =Уі+Уг> *з=Уз 

с матрицей 

/1 -Юч 
А= 1 10, 

\0 0 1/ 

после чего получим: 

(= Чу\ — Ьу^Уз — 8у 2 Уз- 

Теперь коэффициент при у ® отличен от нуля, и поэтому из нашей формы 
можно выделить квадрат одного неизвестного. Полагая 

г і — ^Уі — 2(/ 3 , г 2 = у 2 , 2 3 = р 3 , 



§ 261 ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К КАНОНИЧЕСКОМУ ВИДУ 173 


т. е. совершая линейное преобразование, для которого обратное будет иметь 
матрицу 




мы приведем / к виду 




- 2 г\ — 2 г\ — 8г г г 3 . 


Пока выделился лишь квадрат неизвестного г ъ так как форма еще 
содержит произведение двух других неизвестных. Используя неравенство 
нулю коэффициента при г\, еще раз применим изложенный выше метод. 
Совершая линейное преобразование 

= 2г а — 4г 3 , ( 3 — 2 $, 


для которого обратное имеет матрицу 



мы приведем, наконец, форму / к каноническому виду 


1 

' 2 1 2 

і\+ «1- 

(17) 

Линейное преобразование, приводящее 
иметь своей матрицей произведение 

(16) сразу 

к виду (17), будет 

/ 1 

1 

о \ 


/ 2 

2 

3 \ 


АВС = \ 1 

1 

- • 


\ 2 

2 


\ 0 

0 

1 / 



Можно и непосредственной подстановкой проверить, что невырожденное 
^так как определитель равен — 'тг^ линейное преобразование 

х і = ~2 + 2" + 



превращает (16) в (17). 

Теория приведения квадратичной формы к каноническому виду 
построена по аналогии с геометрической теорией центральных кривых 
второго порядка, но не может считаться обобщением этой послед- 
ней теории. В самом деле, в нашей теории допускается использование 
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любых невырожденных линейных преобразований, в то время как 
приведение кривой второго порядка к каноническому виду дости- 
гается применением линейных преобразований весьма специального 
вида (2), являющихся вращениями плоскости. Эта геометрическая 
теория может быть, однако, обобщена на случай квадратичных форм 
от п неизвестных с действительными коэффициентами. Изло- 
жение этого обобщения, называемого приведением квадра- 
тичных форм к главным осям, будет дано в гл. 8. 

§ 27. Закон инерции 

Канонический вид, к которому приводится данная квадратичная 
форма, вовсе не является для нее однозначно определенным: всякая 
квадратичная форма может быть приведена к каноническому виду 
многими различными способами. Так, рассмотренная в предшествую- 
щем параграфе квадратичная форма /= 2х х х г — 6х 2 х 3 -[-2хзХ 1 не- 
вырожденным линейным преобразованием ' 

Хх — і% + 3/ 2 -{- 2/з, 

Л"2 — і\ 2^3, 

Хз = Із 

приводится к каноническому виду 

отличному от полученного ранее. 

Возникает вопрос, что общего у тех различных канонических 
квадратичных форм, к которым приводится данная форма /? Этот 
вопрос тесно связан, как мы увидим, с таким вопросом: при каком 
условии одна из двух данных квадратичных форм может быть пере- 
ведена в другую невырожденным линейным преобразованием? Ответ 
на эти вопросы зависит, однако, от того, рассматриваются ли ком- 
плексные или действительные квадратичные формы. 

Предположим сначала, что рассматриваются произвольные ком- 
плексные квадратичные формы и, вместе с тем, допускается упо- 
требление невырожденных линейных преобразований также с произ- 
вольными комплексными коэффициентами. Мы знаем, что всякая 
квадратичная форма / от п неизвестных, имеющая ранг г, приводится 
к каноническому виду 

/= с^у \ -)- с 2 _Уа + 

где все коэффициенты с 1г с 2 , . . . , с г отличны от нуля. Пользуясь 
тем, что из всякого комплексного числа извлекается квадратный 
корень, выполним следующее невырожденное линейноепреобразование: 

г і = Ѵ с іУі П Р И 2, ... , г, г } =у } при /=г+ 1, ... , я. 
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Оно приводит форму / к виду 

/ = г 1 4 " 4 + • • • -Г^г, ( 1 ) 

называемому нормальным ; это — просто сумма квадратов г неиз- 
вестных с коэффициентами, равными единице. 

Нормальный вид зависит лишь от ранга г формы /, т. е. все 
квадратичные формы ранга г приводятся к одному и тому же нор- 
мальному виду (1). Если, следовательно, формы / и рр от п неизве- 
стных имеют одинаковый ранг г, то можно перевести / в (1), 
а затем (1) в т. е. существует невырожденное линейное преобразо- 
вание, переводящее / в (*. Так как, с другой стороны, никакое 
невырожденное линейное преобразование не изменяет ранга формы, 
то мы приходим к следующему результату: 

Две комплексные квадратичные формы от п неизвестных 
тогда и только тогда переводятся друг в друга невырожденными 
линейными преобразованиями с комплексными коэффициентами, 
если эти формы имеют один и тот же ранг. 

Из этой теоремы без труда вытекает, что каноническим видом 
комплексной квадратичной формы ранга г может служить вся- 
кая сумма квадратов г неизвестных с любыми отличными от 
нуля комплексными коэффициентами. 

Положение несколько более сложно в том случае, если рассма- 
триваются действительные квадратичные формы и, что особенно 
важно, допускаются лишь линейные преобразования с действительными 
коэффициентами. В этом случае уже не всякую форму можно при- 
вести к виду (1), так как это могло бы потребовать извлечении 
квадратного корня из отрицательного числа. Если, однако, мы назо- 
вем теперь нормальным видом квадратичной формы сумму квадратов 
нескольких неизвестных с коэффициентами +1 или — 1, то легко 
показать, что всякую действительную квадратичную форму / 
можно привести невырожденным линейным преобразованием 
с действительными коэффициентами к нормальному виду. 

В самом деле, форма / ранга г от п неизвестных приводится 
к каноническому виду, который можно записать следующим образом 
(меняя, если нужно, нумерацию неизвестных): 

/ = с іУ\ + • • ■ + с иУь — с к+іУк+і — ••• — с гУг> 0 ^ к 
где все числа с 1 , .. ., с к \ с к+1 , ..., с г отличны от нуля и поло- 
жительны. Тогда невырожденное линейное преобразование с дей- 
ствительными коэффициентами 

г і =я ‘Ѵс і У і при і = \, 2, г / =у / при /=г+ 1, .... п, 

приводит / к нормальному виду, 

-4. 

Общее число входящих сюда квадратов будет равно рангу формы. 
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Действительная квадратичная форма может быть приведена к нор- 
мальному виду многими различными преобразованиями, однако с точ- 
ностью до нумерации неизвестных она приводится лишь к одному 
нормальному виду. Это показывает следующая важная теорема, на- 
зываемая законом инерции действительных квадратичных форм: 

Число положительных и число отрицательных квадратов 
в нормальном виде, к которому приводится данная квадратич- 
ная форма с действительными коэффициентами действительным 
невырожденным линейным преобразованием, не зависят от выбора 
этого преобразования. 

Пусть, в самом деле, квадратичная форма / ранга г от п неиз- 
вестных х ъ х 2 , . . . , х п двумя способами приведена к нормальному 
виду: 

= ^+...+^-2^— ...—2*. (2) 

Так как переход от неизвестных х ІУ х 2 , , х п к неизвестным 

Уъ Уъ • • • , У п был невырожденным линейным преобразованием, то, 
обратно, вторые неизвестные также будут линейно выражаться через 
первые с отличным от нуля определителем: 

Уі= Над, / = 1, 2, ... , п. (3) 

5 = 1 

Аналогично 

п 

/=1, 2, .. . , п, (4) 

і-і 

причем определитель из коэффициентов снова отличен от нуля. 
Коэффициенты же как в (3), так и в (4) — действительные числа. 
Предположим теперь, что к <6.1, и напишем систему равенств 

■Уі = °- .-.»Л = 0. г / +1 = °- ...,2Т, = 0, ...,2 Л = 0. (5) 

Если левые части этих равенств будут заменены их выражениями 
из (3) и (4), мы получим систему п — 14- к линейных однородных 
уравнений с п неизвестными х 1У лг 2 , . . . , х п . Число уравнений в этой 
системе меньше числа неизвестных, поэтому, как мы знаем из § 1, 
наша система обладает ненулевым действительным решением 
« 1 , « 2 > • • • . <*„• 

Заменим теперь в равенстве (2) все у и все г их выражениями (3) 
и (4), а затем подставим вместо неизвестных числа а ІУ а 2 , . . . , а п . 
Если для краткости через у і (а) и г^(а) будут обозначены значения 
неизвестных у. и г у, получающиеся после такой подстановки, то (2) 
превращается, ввиду (5), в равенство 

—уі +1 —Уг («) =*;(“) + ••• +гі і №■ 


( 6 ) 
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Так как все коэффициенты в (3) и (4) действительные, то все квад- 
раты, входящие в равенство (6), положительны, а поэтому (6) влечет 
за собой равенство нулю всех этих квадратов; отсюда следуют 
равенства 

г \ ( а ) = 0 , , ^( а ) = °- ( 7 ) 

С другой стороны, по самому выбору чисел о^, сс 2 , . . . , а п 

2 і+ 1 («) = °» . ... г, (а) = 0, . . . , (а) = 0. (8) 

Таким образом, система п линейных однородных уравнений 
2 і= 0 , і = 1 , 2, ... , п, 

с п неизвестными х х , х 2 , . . . , х п обладает, ввиду (7) и (8), нену- 
левым решением а 1 , а 3 , . . . , а„, т. е. определитель этой системы 
должен быть равен нулю. Это противоречит, однако, тому, что пре- 
образование (4) предполагалось невырожденным. К такому же про- 
тиворечию мы придем при К. к. Отсюда следует равенство к — 1, 
доказывающее теорему. 

Число положительных квадратов в той нормальной форме, к кото- 
рой приводится данная действительная квадратичная форма /, назы- 
вается положительным индексом инерции этой формы, число отри- 
цательных квадратов — отрицательным индексом инерции, а раз- 
ность между положительным и отрицательным индексами инерции — 
сигнатурой формы /. Понятно, что при заданном ранге формы 
задание любого из определенных сейчас трех чисел вполне опреде- 
ляет два других, и поэтому в дальнейших формулировках можно 
будет говорить о любом из этих трех чисел. 

Докажем теперь следующую теорему: 

Две квадратичные формы от п неизвестных с действитель- 
ными коэффициентами тогда и только тогда переводятся друг 
в друга невырожденными действительными линейными преобразо- 
ваниями, если эти формы имеют одинаковые ранги и одинаковые 
сигнатуры. 

В самом деле, пусть форма / переводится в форму § невырож- 
денным действительным преобразованием. Мы знаем, что это пре- 
образование не меняет ранга формы. Оно не может менять и сигна- 
туры, так как в противном случае / и § приводились бы к различным 
нормальным видам, а тогда форма / приводилась бы, в противоречие 
с законом инерции, к этим обоим нормальным видам. Обратно, если 
формы / и $ имеют одинаковые ранги и одинаковые сигнатуры, то 
они приводятся к одному и тому же нормальному виду и поэтому 
могут быть переведены друг в друга. 

Если дана квадратичная форма §■ в каноническом виде, 

*= ь іУІ + ь гУ\ + • • • + Ь гУ 2 г , (9) 
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с не равными нулю действительными коэффициентами, то ранг этой 
формы равен, очевидно, г. Легко видеть, далее, употребляя уже 
применявшийся выше способ приведения такой формы к нормаль- 
ному виду, что положительный индекс инерции формы §• равен числу 
положительных коэффициентов в правой части равенства (9). Отсюда 
и из предшествующей теоремы вытекает такой результат: 

Квадратичная форма / тогда и только тогда будет иметь 
форму (9) своим каноническим видом, если ранг формы / равен г, 
а положительный индекс инерции этой формы совпадает с чис- 
лом положительных коэффициентов в (9). 

Распадающиеся квадратичные формы. Перемножая любые две 
линейные формы от п неизвестных, 

<р = а х х х + а 2 х 2 а п х п , ф = Ь х х \ + Ь 2 Х г 2 + . . . + Ь Л х п1 

мы получим, очевидно, некоторую квадратичную форму. Не всякая 
квадратичная форма может быть представлена в виде произведения 
двух линейных форм, и мы хотим вывести услЪвия, при которых это 
имеет место, т. е. при которых квадратичная форма является рас- 
падающейся. 

Комплексная квадратичная форма /( х х , х 2 , . . . , х п ) распа- 
дается тогда и только тогда, если ее ранг меньше или равен 

двум. Действительная квадратичная форма /( х х , х 2 х а ) 

распадается тогда и только тогда, если или ее ранг не больше 
единицы, или же он равен двум, а сигнатура равна нулю. 

Рассмотрим сначала произведение линейных форм ф и ф. Если 
хотя бы одна из этих форм нулевая, то их произведение будет 
квадратичной формой с нулевыми коэффициентами, т. е. оно имеет 
ранг 0. Если линейные формы ф и ф пропорциональны, 


ф = сф, 


причем с^О и форма ф ненулевая, то пусть, например, коэффи- 
циент а х отличен от нуля. Тогда невырожденное линейное преоб- 
разование 

у х = а х х х + . , , + а п х п , Уі = Х( при 1=2, 3, . . . , я 
приводит квадратичную форму фф к виду 

фф = с,у“. 

Справа стоит квадратичная форма ранга 1, а поэтому и квадратичная 
форма фф имеет ранг 1. Если же, наконец, линейные формы ф и ф 
не являются пропорциональными, то пусть, например, 



§ 28] ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННЫЕ ФОРМЫ 

Тогда линейное преобразование 


179 


Уі = + 4 х г + • • • + «А, 

У г = Ь 1 х 1 + Ь 2 х 2 + . . . + Ь п х п , 

Уі — Хі при і = 3, 4, , л 

будет невырожденным; оно приводит квадратичную форму фф к виду 

<И> = .УіДѴ 

Справа стоит квадратичная форма ранга 2, имеющая в случае дей- 
етвительных коэффициентов сигнатуру 0. 

Перейдем к доказательству обратного утверждения. Квадратич- 
ная форма ранга 0 может, конечно, рассматриваться как произве- 
дение двух линейных форм, одна из которых нулевая. Далее, 
квадратичная форма /{х х , х 2 , ..., ранга 1 невырожденным 
линейным преобразованием приводится к виду 

/= су\, сфО, 

т. е. к виду 

/=№і)Уѵ 

Выражая у ѵ линейно через лгі, х 2 , . , . , х п , мы получим представле- 
ние формы / в виде произведения двух линейных форм. Наконец, 
действительная квадратичная форма /{х и х 2 , .... х п ) ранга 2 
и сигнатуры 0 приводится невырожденным линейным преобразова- 
нием к виду 

/=УІ-УІ; 

к этому же виду может быть приведена любая комплексная квадра- 
тичная форма ранга 2. Однако 

УІ~УІ=ІУі-Уг) (Уі+Уг), 

но справа, после замены у х и у г их линейными выражениями через 
х і, х 2 -> . . . , х „, будет стоять произведение двух линейных форм. 
Теорема доказана. 

§ 28. Положительно определенные формы 

Квадратичная форма / от л неизвестных с действитель- 
ными коэффициентами называется положительно определенной, 
если она приводится к нормальному виду, состоящему из л поло- 
жительных квадратов, т. е, если и ранг, и положительный ин- 
декс инерции этой формы равны числу неизвестных. 

Следующая теорема дает возможность охарактеризовать поло- 
жительно определенные формы, не приводя их к нормальному или 
каноническому виду. 
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Квадратичная форма / от п неизвестных Хі, х г , .... х п с дей- 
ствительными коэффициентами тогда и только тогда будет 
положительно определенной, если при всяких действительных 
значениях этих неизвестных, хотя бы одно из которых отлично 
от нуля, эта форма получает положительные значения. 

Доказательство. Пусть форма / положительно определен- 
ная, т. е. приводится к нормальному виду 

/=>; +уі + • • ■ +^. ( і ) 

причем 

Уі— 2 а іЛ. і = 2. (2) 

с отличным от нуля определителем из действительных коэффициен- 
тов а,,. Если мы хотим подставить в / произвольные действитель- 
ные значения неизвестных хі, х 2 , . . . , х п , хотя бы одно из которых 
отлично от нуля, то можно подставить их сначала в (2), а затем 
значения, полученные для всех у ІУ — в (1). Заметим, что значения, 
полученные для у и у г , . . . , у п из (2), не могут все сразу равняться 
нулю, так как иначе мы получили бы, что система линейных одно- 
родных уравнений 

п 

0, * == 1, 2, .... л, 

обладает ненулевым решением, хотя ее определитель отличен от 
нуля. Подставляя найденные для _у ь у 2 , . . . , у п значения в (1), мы 
получим значение формы /, равное сумме квадратов п действитель- 
ных чисел, которые не все равны нулю; это значение будет, следо- 
вательно, строго положительным. 

Обратно, пусть форма / не является положительно определенной, 
т. е. или ее ранг, или положительный индекс инерции меньше п. 
Это означает, что в нормальном виде этой формы, к которому она 
приводится, скажем, невырожденным линейным преобразованием [2), 
квадрат хотя бы одного из новых неизвестных, например у п , или 
отсутствует совсем, или же содержится со знаком минус. Покажем, 
что в этом случае можно подобрать такие действительные значения 
для неизвестных Хі, дг 2 , . . . , х п , которые не все равны нулю, что 
значение формы / при этих значениях неизвестных равно нулю или 
даже отрицательно. Такими будут, например, те значения для 
Хі, х 2 , . . . , х п , которые мы получим, решая по правилу Крамера 
систему линейных уравнений, получающихся из (2) прн_уі=_У 2 — • ■ • 

. . . ~Уп-і — 0, у п — 1. Действительно, при этих значениях неиз- 
вестных Хі, х 2 , .... х п форма / равна нулю, если у% не входит 
в нормальный вид этой формы, и равна — 1, если у* входит в нор- 
мальный вид со знаком минус. 



ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННЫЕ ФОРМЫ 


181 


§ 28] 


Теорема, сейчас доказанная, используется всюду, где применя- 
ются положительно определенные квадратичные формы. С ее по- 
мощью нельзя, однако, по коэффициентам формы установить, будет 
ли эта форма положительно определенной. Для этой цели служит 
другая теорема, которую мы сформулируем и докажем после того, 
как введем одно вспомогательное понятие. 

Пусть дана квадратичная форма / от л неизвестных с матрицей 
А — (а,.). Миноры порядка 1, 2, ... , л этой матрицы, расположен- 
ные в ее левом верхнем углу, т. е. миноры 
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из которых последний совпадает, очевидно, с определителем мат- 
рицы А, называются главными минорами формы /. 

Справедлива следующая теорема: 

Квадратичная форма / от п неизвестных с действительными 
коэффициентами тогда и только тогда будет положительно 
определенной, если все ее главные миноры строго положительны . 

Доказательство. При л=1 теорема верна, так как форма 
имеет в этом случае вид ах 2 и поэтому положительно определена 
тогда и только тогда, если а> 0. Будем поэтому доказывать тео- 
рему для случая п неизвестных, предполагая, что для квадратичных 
форм от л — 1 неизвестных она уже доказана. 

Сделаем сначала следующее замечание: 

Если квадратичная форма / с действительными коэффициентами, 
составляющими матрицу А, подвергается невырожденному линейному 
преобразованию с действительной матрицей <), то знак определи- 
теля формы (т. е. определителя ее матрицы) не меняется. 
Действительно, после преобразования мы получаем квадратичную 
форму с матрицей С)' АС), однако, ввиду |<2' | = |<Э|, 

|дма|=|д'нл|'|д! = ммс| 2 , 

т. е. определитель | А | умножается на положительное число. 

Пусть теперь дана квадратичная форма 

П 

/= 2 а и х і х р 

і,і=і 

Ее можно записать в виде 

П-1 

/=Ф(ДГ 1 , х%, і) + 2 2 а іп х і х п + а пп Хп, (3) 

1 = 1 

где ф будет квадратичной формой от л — 1 неизвестных, составлен- 
ной из тех членов формы /, в которые не входит неизвестное х п . 
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Главные миноры формы <р совпадают, очевидно, со всеми, кроме 
последнего, главными минорами формы /. 

Пусть форма / положительно определена. Форма ф также будет 
в этом случае положительно определенной: если бы существовали 
такие значения неизвестных х г , х 2 , ... , х„~і, не все равные нулю, 
при которых форма ф получает не строго положительное значение, 
то, полагая дополнительно х„ = 0, мы получили бы, ввиду (3), также 
не строго положительное значение формы /, хотя не все значения 
неизвестных х 1г х. г , ... , х п _ г , х п равны нулю. Поэтому, по индук- 
тивному предположению, все главные миноры формы ф, т. е. все 
главные миноры формы /, кроме последнего, строго положительны. 
Что же касается последнего главного минора формы /, т. е. опре- 
делителя самой матрицы А, то его положительность вытекает из 
следующих соображений: форма /, ввиду ее положительной опреде- 
ленности, невырожденным линейным преобразованием приводится 
к нормальному виду, состоящему из л положительных квадратов. 
Определитель этого нормального вида строго^ положителен, а по- 
этому ввиду сделанного выше замечания положителен и опреде- 
литель самой формы /. 

Пусть теперь строго положительны все главные миноры формы /. 
Отсюда вытекает положительность всех главных миноров формы ф, 
т. е., по индуктивному предположению, положительная определен- 
ность этой формы. Существует, следовательно, такое невырожденное 
линейное преобразование неизвестных лг 1 , х 2 , .... х п _ г , которое 
приводит форму ф к виду суммы п — 1 положительных квадратов 
от новых неизвестных у г , у г , ..., у п _ ѵ Это линейное преобразо- 
вание можно дополнить до (невырожденного) линейного преобразо- 
вания всех неизвестных д: 1 , х г , ..., х п , полагая х п — у„. Ввиду 
(3) форма / приводится указанным преобразованием к виду 

/=2л ? + 2 2 ЬіпУіУп+ь^уъ (4) 

і=і 

точные выражения коэффициентов Ь іп для нас несущественны. Так 
как 

УІ + ЩнУіУп = (Уі + *>іпУа ) 2 - ад. 
то невырожденное линейное преобразование 

гі=Уі + Ь іп у п , /= 1, 2 л — 1, 

*» = Уп 

приводит, ввиду '(4), форму / к каноническому виду 

/= + 

1 = 1 


(О) 
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Для доказательства положительной определенности формы / 
остается доказать положительность числа с. Определитель формы, 
стоящей в правой части равенства (5), равен с. Этот определитель 
должен, однако, быть положительным, так как правая часть равен- 
ства (5) получена из формы / двумя невырожденными линейными 
преобразованиями, а определитель формы / был, как последний из 
главных миноров этой формы, положительным. 

Доказательство теоремы закончено. 


Примеры 1. Квадратичная форма 

1 = + 4x^2 — 8х,х 3 — 4х 2 х 3 


положительно определена, так как ее главные миноры 


б, 


5 2 

= 1. 

2 1 

* 1 



положительны. 

2. Квадратичная форма 



1 


I г=: Зх \ + х* + 5х* 4- 4х 1 х 2 — вХіХз — 4 х 2 х 3 

не будет положительно определенной, так как ее второй главный минор 
отрицателен: 



Заметим, что по аналогии с положительно определенными квадра- 
тичными формами можно ввести отрицательно определенные формы, 
т. е. такие невырожденные квадратичные формы с действительными 
коэффициентами, нормальный вид которых содержит лишь отрица- 
тельные квадраты неизвестных. Вырожденные квадратичные формы, 
нормальный вид которых состоит из квадратов одного знака, назы- 
ваются иногда полуопределенными. Наконец, неопределенными 
будут такие квадратичные формы, нормальный вид которых содержит 
как положительные, так и отрицательные квадраты неизвестных. 



ГЛАВА СЕДЬМАЯ 

ЛИНЕЙНЫЕ ПРОСТРАНСТВА 

§ 29. Определение линейного пространства. Изоморфизм 

Определение я-мерного векторного пространства, данное в § 8, 
начиналось с определения я-мерного вектора как упорядоченной 
системы я чисел. Для я-мерных векторов были, введены затем сло- 
жение и умножение на числа, что и привело к понятию я-мерного 
векторного пространства. Первыми примерами векторных пространств 
являются совокупности векторов-отрезков, выходящих из начала 
координат на плоскости или в трехмерном пространстве. Однако, 
встречаясь с этими примерами в курсе геометрии, мы не всегда 
считаем необходимым задавать векторы их компонентами в некото- 
рой фиксированной системе координат, так как и сложение векторов 
и их умножение на скаляр определяются геометрически, независимо 
от выбора системы координат. Именно, сложение векторов на пло- 
скости или в пространстве производится по правилу параллело- 
грамма, а умножение вектора на число а означает растяжение этого 
вектора в ос раз (с изменением направления вектора на противо- 
положное, если а отрицательно). Целесообразно и в общем случае 
дать «бескоординатное» определение векторного пространства, т. е. 
определение, не требующее задания векторов упорядоченными систе- 
мами чисел. Сейчас будет дано такое определение. Это определение 
является аксиоматическим: в нем ничего не будет сказано 
о свойствах отдельного вектора, но будут перечислены те свойства, 
которыми должны обладать операции над векторами. 

Пусть дано множество V ; его элементы будут обозначаться 
малыми латинскими буквами: а, Ь, с, ... 1 ). Пусть, далее, в мно- 
жестве V определены операция сложения, ставящая в соответствие 
всякой паре элементов а, Ь из У однозначно определенный эле- 
мент а + Ь из V, называемый их суммой, и операция умножения 
на действительное число, причем произведение а а элемента а на 
число а однозначно определено и принадлежит к V. 

х ) В отличие от того, что было принято в гл. 2, мы будем в настоящей 
и следующей главах обозначать векторы малыми латинскими буквами, 
а числа — малыми греческими буквами. 
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Элементы множества V будут называться векторами , а само 
V — действительным линейным (или векторным, или аффинным) 
пространством, если указанные операции обладают следующими 
свойствами 1 — VIII: 

I. Сложение коммутативно, а-\-Ь — Ь-\-а. 

II. Сложение ассоциативно, (а-\-Ь)-\-с = а-\-(Ь + с). 

III. В V существует нулевой элемент 0, удовлетворяющий усло- 
вию: а-{-0 = а для всех а из V. 

Легко доказать, используя I, единственность нулевого эле- 
мента: если 0 Х и 0, — два нулевых элемента, то 

Оі Н-Ог = 

Оі _ Ь Ог ^ 0 г = 0 2 , 

откуда 0 г — 0 2 . 

IV. Для всякого элемента а в V существует противоположный 
элемент — а, удовлетворяющий условию: а-\-{ — а) — 0. 

Легко проверяется, ввиду II и I, единственность противопо- 
ложного элемента: если ( — а) 1 и ( — а) 2 — два противоположных 
элемента для а , то 

(— ' ®)і + [ а + (— ' «)*1 = (— ' »і) + 0 = (— , а) ѵ 

[( — а )і + а Н" ( — а )г — о + ( — в) 2 — ( — а) 2 , 


откуда (— а) 1 = (— а) 2 . 

Из аксиом I — IV выводится существование и единственность 
разности а — Ь, т. е. такого элемента, который удовлетворяет 
уравнению 

Ь-\-х=а. (1) 

Действительно, можно положить 

а — Ь = а-\-( — Ь), 

так как 

Ь + [а 4 - ( — Ь)\ = [Ь + ( — /»)] + а = 0-)-а = а. 

Если же существует еще такой элемент с, который удовлетворяет 
уравнению (1), т. е. 

Ь -]- с = а, 

то, прибавляя к обеим частям этого равенства элемент — Ь, полу- 
чаем, что 

с — а-\- ( — Ь). 

Дальнейшие аксиомы V — VIII (ср. § 8) связывают умножение на 
число со сложением и с операциями над числами. Именно, для 
любых элементов а, Ь из V , для любых действительных чисел а, (3 



ЛИНЕЙНЫЕ ПРОСТРАНСТВА 


186 


[гл. 7 


и для действительного числа 1 должны иметь место равенства: 


V. 

а(а + Ь) = аа-\- а Ь\ 

VI. 

(а + (3) а = аа ра; 

VII. 

(аР)а — а (Ра); 

VIII. 

1 -а = а. 


Укажем некоторые простейшие следствия из этих аксиом. 

[1] . а-0 = 0. 

Действительно, для некоторого а из V 

а а = а (а + 0 ) = аа + а • 0 , 

т. е. 

а-0 — Сіа — аа = аа-}-[ — (аа)] = 0. 

[2] . 0 • а = 0, 

где слева стоит число нуль, а справа — нулевой элемент из V. 
Для доказательства возьмем любое число а. Тогда 

аа = (а + 0 ) а — аа -\- 0 • а, 

откуда 

0 • а = аа — аа — 0 . 


[3] . Если аа = 0, то или а = 0, или а~ 0. 

Действительно, если афО, т. е. число а -1 существует, то 
а = 1 - а — (а -1 а) а =а~ г (аа) — а~ 1 -0 = 0. 

[4] . а( — а) = — аа. 

В самом деле, 

аа + а ( — с) = а [а + ( — а)] = а • 0 = 0, 
т. е. элемент а ( — а) противоположен элементу аа. 

[5] . ( — а)а = — аа. 

Действительно, 

а а + ( — а) а —■ [а + ( — «)] а = 0 • а = 0, 
т. е. элемент ( — а) а противоположен- элементу а а. 

[6] . а (а — Ь) — аа — а Ь. 

Действительно, по [4], 

а (а — Ь) = а [аД- ( — Ь)] = аа-\-а ( — Ь) = ааД- ( — аЬ) = аа — а Ь. 

[7] . (сі — Р)с = ас — (За. 

В самом деле, 

(а — (3 ) а = [а ч~ ( — (3)] а = аа Д- [ — 13) а = аа Д- ( — (За) — аа — ра. 
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Заметим, что перечисленными выше аксиомами и следствиями 
из них мы будем пользоваться дальше без специальных оговорок. 

Выше дано определение действительного линейного простран- 
ства. Если бы мы предположили, что в множестве V определено 
умножение не только на действительные, но и на любые комплекс- 
ные числа, то, сохраняя те же аксиомы 1 — VIII, получили бы опре- 
деление комплексного линейного пространства. Для определен- 
ности ниже рассматриваются действительные линей- 
ные пространства, однако все, что будет сказано 
в настоящей главе, переносится дословно на случай 
комплексных линейных пространств. 

Примеры действительных линейных пространств могут быть 
легко указаны. Ими будут, прежде всего, те я-мерные действитель- 
ные векторные пространства, составленные из векторов-строк, кото- 
рые изучались в гл. 2. Линейными пространствами будут и множе- 
ства векторов-отрезков, выходящих из начала координат на пло- 
скости или в трехмерном пространстве, если операции сложения 
и умножения на число понимать в том геометрическом смысле, 
который был указан в начале параграфа. 

Существуют также примеры линейных пространств, так сказать 
«бесконечномерных». Рассмотрим всевозможные последовательности 
действительных чисел; они имеют вид 

а — (оі^, сц, • . • і 

Операции над последовательностями будем производить покомпо- 
нентно: если 

^ ~ (Рі> Рг> • • • і Рп< • • •)• 
то 

а + Ь==(а 1 + р х , а г +р. 2 , .... а„ + Р п , ...): 
с другой стороны, для любого действительного числа у 
у а — (уа 1 , уос 2 , ... , уа п , ...). 

Все аксиомы I — VIII выполняются, т. е. мы получаем действитель- 
ное линейное пространство. 

Примером бесконечномерного пространства будет также мно- 
жество всевозможных действительных функций действительного 
переменного, если сложение функций и их умножение на действи- 
тельное число понимать так, как это принято в теории функций, 
т. е. как сложение или умножение на число значений функций при 
каждом значении независимого переменного. 

Изоморфизм. Нашей ближайшей целью будет выделение среди 
всех линейных пространств тех, которые естественно назвать ко- 
нечномерными. Введем сначала одно общее понятие. 

В определении линейного пространства говорилось о свойствах 
операций над векторами, но ничего не говорилось о свойствах 
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самих векторов. Ввиду этого может случиться, что хотя векторы 
некоторых двух данных линейных пространств по своей природе 
совершенно различны, однако с точки зрения свойств операций эти 
два пространства неразличимы. Точное определение таково: 

Два действительных линейных пространства V и V' называются 
изоморфными , если между их векторами установлено взаимно од- 
нозначное соответствие — всякому вектору а из V сопоставлен век- 
тор а' из V', образ вектора а, причем различные векторы из V 
обладают различными образами и всякий вектор из V служит обра- 
зом некоторого вектора из V, — и если при этом соответствии 
образом суммы двух векторов служит сумма обра- 
зов этих векторов, 

(а + Ь)' = а' + Ь\ (2) 

а образом произведения вектора на число служит 
произведение образа этого вектора на то же число, 

(аа)'~аа'. (3) 

Отметим, что взаимно однозначное соответствие между про- 
странствами V и V, удовлетворяющее условиям (2) и (3), назы- 
вается изоморфным соответствием. 

Так, пространство векторов-отрезков на плоскости, выходящих 
из начала координат, изоморфно двумерному векторному простран- 
ству, составленному из упорядоченных пар действительных чисел: 
мы получим изоморфное соответствие между этими пространствами, 
если на плоскости фиксируем некоторую систему координат и вся- 
кому вектору-отрезку сопоставим упорядоченную пару его коор- 
динат. 

Докажем следующее свойство изоморфизма линейных пространств: 
образом нуля пространства V при изоморфном соответствии 
между пространствами V и V служит нуль пространства V'. 

Пусть, в самом деле, а будет некоторый вектор из V, а' — его 
образ в V. Тогда, ввиду (2), 

а' = (а + 0)' = я' + 0', 
т. е. О' будет нулем пространства V". 

§ 30. Конечномерные пространства. Базы 

Как читатель без труда может проверить, те два определения 
линейной зависимости векторов-строк, которые были даны 
в § 9, равно как и доказательство эквивалентности этих определе- 
ний, используют лишь операции над векторами и поэтому могут 
быть перенесены на случай любых линейных пространств. В аксио- 
матически определенных линейных пространствах можно говорить, 
следовательно, о линейно независимых системах векторов, о макси- 
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мальных линейно независимых системах, если такие существуют, 
и т. д. 

Если линейные пространства V и V' изоморфны, то система 
векторов а ѵ а г , , а к из V тогда и только тогда линейно 
зависима, если линейно зависима система их образов а х , а*, .... а* 

в V. 

Заметим, что если соответствие а ->■ а' (для всех а из V) является 
изоморфным соответствием между V и V , то и обратное соответ- 
ствие а' -*■ а также будет изоморфным. Поэтому достаточно рас- 
смотреть случай, когда линейно зависима система о 1 , а 2 , ... , а к . 
Пусть существуют такие числа а 1 , а 2 , . . . ,а А , не все равные нулю, 
что 

а і«і + «2 а 2 + . . • +«А= 0. 

Образом правой части этого равенства при рассматриваемом изомор- 
физме служит, как мы знаем, нуль 0' пространства V . Беря образ 
левой части и применяя несколько раз (2) и (3), получаем 

®1 а 1 "Ь • • • "Ь ® ) 

т. е. система а\, а г , . . . , а к также оказалась линейно зависимой. 

Конечномерные пространства. Линейное пространство V назы- 
вается конечномерным, если в нем можно найти конечную макси- 
мальную линейно независимую систему векторов; всякая такая 
система векторов будет называться базой пространства V. 

Конечномерное линейное пространство может обладать многими 
различными базами. Так, в пространстве векторов-отрезков на пло- 
скости базой служит любая пара векторов, отличных от нуля и не 
лежащих на одной прямой. Заметим, что наше определение конечно- 
мерного пространства не дает пока ответа на вопрос, могут ли 
в этом пространстве существовать базы, состоящие из разного 
числа векторов. Больше того, можно было бы допустить даже, что 
в некоторых конечномерных пространствах существуют базы со 
сколь угодно большим числом векторов. Сейчас мы приступим к 
выяснению того, каково же положение на самом деле. 

Пусть линейное пространство V обладает базой 

е і> е 2 , .... е п , (1) 

состоящей из п векторов. Если а — произвольный вектор из V, то 
из максимальности линейно независимой системы (1) следует, что а 
линейно выражается через эту систему, 

а =а 1 е 1 -\-а 2 е 2 -\- . . . -т~а п е„. (2) 

С другой стороны, ввиду линейной независимости системы (1) 
выражение (2) будет для вектора а единственным: если 

а =<х 1 е 1 -\-а і е і + . . . -\-<х п е п , 
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ТО 


откуда 


(«і— аі) е х + (а 2 — <х 2 ) е 3 -ф {а п —а' п ) е п = 0, 


/ = 1, 2, , п. 

Таким образом, вектору а однозначно соответствует строка 

(«і, ® а . • • • . ( 3 ) 


коэффициентов его выражения (2) через базу (1) или, как мы будем 
говорить, строка его координат в базе (1). Обратно, всякая строка 
вида (3), т. е. всякий я-мерный вектор в смысле гл. 2, служит 
строкой координат в базе (1) для некоторого вектора пространства V, 
а именно для вектора, записывающегося через базу (1) в виде (2). 

Мы получили, следовательно, взаимно однозначное соответствие 
между всеми векторами пространства V и всеми векторами я-мер- 
ного векторного пространства строк. Покажем, что это соответствие, 
зависящее, понятно, от выбора базы (1), является изоморфным. 

Возьмем в пространстве V, помимо вектора а, выражающегося 
через базу (1) в виде (2), также вектор Ь, выражение которого 
через базу (1) будет 

+ р 2 е 2 -)~ . . . 

Тогда 

а + Ь — (а х + е ѵ + (« 2 + Р 2 ) е 2 -ф . . . + (®„ + Р„) е п , 

т. е. сумме векторов а и Ь соответствует сумма строк их 
координат в базе (1). С другой стороны, 

уа= (Ѵ«і) е х + (уа 2 ) е г +...+ (уа„) е п , 


т. е. произведению вектора а на число у соответствует произ- 
ведение строки его координат в базе (1) на это же число у. 

Этим доказана следующая теорема: 

Всякое линейное пространство, обладающее базой из п век- 
торов, изоморфно п-мерному векторному пространству строк. 

Как мы знаем, при изоморфном соответствии между линейными 
пространствами линейно зависимая система векторов переходит 
в линейно зависимую и обратно, а поэтому линейно независимая 
переходит в линейно независимую. Отсюда следует, что при изо- 
морфном соответствии база переходит в базу. 

В самом деле, пусть база е 1У е 2 , . . . , е„ пространства V пере- 
ходит при изоморфном соответствии между пространствами V и V' 
в систему векторов е х , е 2 , ... ,е„ пространства V , которая хотя и 
линейно независима, но не является максимальной. В V можно 
найти, следовательно, такой вектор /', что система е и е 2 , . . . , е„, 
/' остается линейно независимой. Вектор /' служит, однако, образом 
при рассматриваемом изоморфизме для некоторого вектора / из V. 
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Мы получаем, что система векторов е ІУ е. 2 , е п , / должна быть 

линейно независимой в противоречие с определением базы. 

Мы знаем, далее (см. § 9), что в / 2 -мерном векторном пространстве 
строк все максимальные линейно независимые системы состоят кз 
л векторов, что всякая система из я + 1 вектора линейно зависима 
и что всякая линейно независимая система векторов содержится 
в некоторой максимальной линейно независимой системе. Используя 
установленные выше свойства изоморфных соответствий, мы при- 
ходим к следующим результатам: 

Все базы конечномерного линейного пространства V состоят 
из одного и того же числа векторов. Если это число равно п, 
то V будет называться п-мерным линейным пространством, 
а число п — размерностью этого пространства. 

Всякая система из п-\-\ вектора п-мерного линейного про- 
странства линейно зависима. 

Всякая линейно независимая система векторов п-мерного 
линейного пространства содержится в некоторой базе этого 
пространства. 

Теперь легко проверить, что указанные выше примеры действи- 
тельных линейных пространств — пространство последовательностей 
и пространство функций — не являются конечномерными простран- 
ствами: в каждом из этих пространств читатель без труда найдет 
линейно независимые системы, состоящие из сколь угодно большого 
числа векторов. 

Связь между базами. Объектом изучения являются для нас 
конечномерные линейные пространства. Понятно, что, изучая л-мер- 
ные линейные пространства, мы по существу изучаем то я-мерное 
векторное пространство строк, которое было введено еще в гл. 2. 
Однако раньше в этом пространстве была выделена одна база — 
а именно база, составленная из единичных векторов, т. е. векторов, 
у которых одна координата равна единице, а все остальные коор- 
динаты равны нулю, — и все векторы пространства задавались стро- 
ками их координат в этой базе; теперь же все базы пространства 
являются для нас равноправными. 

Посмотрим, как много баз можно найти в я-мерном линейном 
пространстве и как эти базы связаны друг с другом. 

Пусть в л-мерном линейном пространстве V заданы базы 


е 1> • • • » 

(4) 

&ІУ • • • » &П» 

(5) 


Каждый вектор базы (5), как и всякий вектор пространства V, 
однозначно записывается через базу (4), 

П 

е і — і = 1 , 2 , • . . , ті ѣ ( 6 ) 

/=і 
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Матрица 

/ Т 11 • • • Т 1п\ 

Т=\ , 

\*«1 . . . Х пп ) 

строки которой являются строками координат векторов (5) в базе (4), 
называется матрицей перехода от базы (4) к базе (5). 

Связь между базами (4) и (5) и матрицей перехода Т можно 
записать, ввиду (6), в виде матричного равенства 



или, обозначая базы (4) и (5), записанные в столбец, соот- 
ветственно через е и е', в виде 

е' = Те. 


С другой стороны, если Т — матрица перехода от база (5) 
к базе (4), то 

е = Т'е' . 

Отсюда 


е = (Г Г) е, 


в' = (7Г)в\ 


т. е., ввиду линейной независимости баз е и е', 

ГТ — ТТ = Е, 


откуда 


Г = Т~\ 


Этим доказано, что матрица перехода от одной базы к другой 
всегда является невырожденной матрицей. 

Всякая невырожденная квадратная матрица порядка п с 
действительными элементами служит матрицей перехода от 
данной базы п-мерного действительного линейного пространства 
к некоторой другой базе. 

Пусть, в самом деле, дана база (4) и невырожденная матрица Т 
порядка п. Возьмем в качестве (5) систему векторов, для которых 
строки матрицы Т служат строками координат в базе (4); имеет 
место, следовательно, равенство (7). Векторы (б) линейно незави- 
симы — линейная зависимость между ними влекла бы за собой 
линейную зависимость строк матрицы Т в противоречие с ее невы- 
рожденностью. Поэтому система (5), как линейно независимая 
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система, состоящая из я векторов, является базой нашего простран- 
ства, а матрица Т служит матрицей перехода от базы (4) к базе (5). 

Мы видим, что в я-мерном линейном пространстве можно найти 
столь же много различных баз, как много существует различных 
невырожденных квадратных матриц порядка я. Правда, при этом 
две базы, состоящие из одних и тех же векторов, но записанных 
в различном порядке, считаются различными. 

Преобразование координат вектора. Пусть в я-мерном линей- 
ном пространстве даны базы (4) и (5) с матрицей перехода Т — (т,у), 

е' — Те. 

Найдем связь между строками координат произвольного вектора а 
в этих базах. 

Пусть 

П 

Я = 2 «/,, ( 8 ) 

/= 1 
П 

а = 2 а і е і • 
і=і 

Используя (6), получаем: 



Сравнивая с (8) и используя единственность записи вектора через 
базу, получаем: 

П 

а ) — 2 а і г і], /’= 1 , 2, .... я, 

1 — 1 

т. е. имеет место матричное равенство 

(®і. «г. • • • - а ») = («і. «2, .... а п) Т. 

Таким образом, строка координат вектора а в базе е равна 
строке координат этого вектора в базе е' , умноженной справа 
на матрицу перехода от базы е к базе е' . 

Отсюда следует, понятно, равенство 

(«і, «2, , а«) = («і, а п ) Г -1 . 

Пример. Рассмотрим трехмерное действительное линейное простран- 
ство с базой 

е і> <? 2 , е 3 . (9) 

Векторы 

е 2 ==:5 б 2 2е 3 , 
е 2 = 2е г + Зв 2 , 
е з~ — % е і + е 2 + с 3 


( 10 ) 
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также составляют базу в этом пространстве, причем матрицей перехода 
от (9) к (10) служит матрица 



/ 5 

-1 -2ч 


Г= 2 

3 0 ), 

откуда 

V— 2 

1 1/ 


( 3 

-1 6ч 


Г-»= —2 

1 —4). 

Вектор 

V 8 

— 3 17/ 


а — е 1 -р4е 2 —е 3 


имеет поэтому в базе (10) строку координат 

/3 -1 6 Х 

(«;, «;, а 3 ) = (1, 4, -1) -2 1 -4 ) = ( — 13, 6, 


т. е. 


8 —3 17. 

а = — 13е 1 + 6е 2 — 27е 3 . 


-27), 


§ 31. Линейные преобразования 

В гл. 3 мы уже встречались с понятием линейного преобразова- 
ния неизвестных. Понятие, которое будет сейчас введено, носит 
такое же название, но имеет иной характер. Впрочем, некоторые 
связи между этими двумя одноименными понятиями могли бы быть 
указаны. 

Пусть дано л-мсрное действительное линейное пространство, ко- 
торое обозначим через Ѵ п . Рассмотрим преобразование этого про- 
странства, т. е. отображение, переводящее каждый вектор а про- 
странства Ѵ п в некоторый вектор а' этого же пространства. Вектор а' 
называется образом вектора а при рассматриваемом преобразовании. 

Если преобразование обозначено через <р, то образ вектора а 
условимся записывать не через ф (а) или фа, что читателю было бы 
привычнее, а через аф. Таким образом, 

а' = а ф. 

Преобразование ф линейного пространства Ѵ п называется линей- 
ным преобразованием этого пространства, если сумму любых двух 
векторов а, Ь оно переводит в сумму образов этих векторов, 

(а + г>)ф = Яф-|-6ф, (1) 

а произведение любого вектора а на любое число а переводит 
в произведение образа вектора а -на это же число а, 

(аа)ф=а(аф). (2) 

Из этого определения немедленно вытекает, что линейное пре- 
образование линейного пространства переводит любую линейную 
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комбинацию данных векторов а г , а 2 , . . . , а к в линейную комби . - 
нацию (с теми же коэффициентами) образов этих векторов, 

(а А + а А + . . . + а к а к ) <р = а х (о х ф) + а 2 (а 2 ф) + ...+% (а А ф). (3) 

Докажем следующее утверждение: 

При любом линейном преобразовании ф линейного простран- 
ства Ѵ п нулевой вектор 0 остается неподвижным, 

0ф = 0, 

а образом вектора, противоположного для данного вектора а , 
служит вектор , противоположный для образа вектора а , 

( — а) ф = — а ф. 

В самом деле, если Ь — произвольный вектор, то, ввиду (2,), 

Оф = (0 • Ь) ф = О • (йф) = 0. 

С другой стороны, 

(— а) ф = [(— 1) а] ф = (— 1 ) (яф) = — яф. 

Понятие линейного преобразования линейного пространства воз- 
никло как обобщение известного из курса аналитической геометрии 
понятия аффинного преобразования плоскости или трехмерного про- 
странства; действительно, условия (1) и (2) для аффинных преобра- 
зований выполняются. Эти условия выполняются и для проекций 
векторов на плоскости или в трехмерном пространстве на некоторую 
прямую (или на некоторую плоскость). Таким образом, например, 
в двумерном линейном пространстве векторов-отрезков, выходящих 
из начала координат плоскости, преобразование, переводящее всякий 
вектор в его проекцию на некоторую ось, проходящую через начало 
координат, будет линейным преобразованием. 

Примерами линейных преобразований в произвольном простран- 
стве Ѵ п служат тождественное преобразование е, оставляющее 
всякий вектор я на месте, 

яе = я, 

и нулевое преобразование м, отображающее всякий вектор я в нуль, 

я(о = 0. 

Сейчас будет получено некоторое обозрение всех линейных 
преобразований линейного пространства Ѵ п . Пусть 

е іі е г> • • • > е п ( 4 ) 

— база этого пространства; как и раньше, базу (4), расположенную 
в столбец, будем обозначать через е. Так^как всякий вектор я про- 
странства Ѵ п однозначно представляется в виде линейной комбинации 



196 


ЛИНЕЙНЫЕ ПРОСТРАНСТВА 


[ГЛ. 7 


векторов базы (4), то, ввиду (3), образ вектора а с теми же коэф- 
фициентами выражается через образы векторов (4). Иными словами, 
всякое линейное преобразование ф пространства Ѵ п однозначно 
определяется заданием образов е г ф, е 2 ср, . . . , е„ф всех векторов 
фиксированной базы (4). 

Какова бы ни была -упорядоченная система из п векторов 
пространства Ѵ п , 

С 1> С 2> • • • I С пі (5) 

существует , притом единственное , такое линейное преобразо- 
вание ф этого пространства , что (5) служит системой образов 
векторов базы (4) при этом преобразовании , 

е,-ф = с,-, і = 1 , 2, . . . , л. (6) 

Единственность преобразования ф уже доказана выше и нужно 
доказать лишь его существование. Определим преобразование ф 
следующим образом: если а — произвольный вектор пространства и 

а = 2 

1 = 1 

— его запись в базе (4), то положим 

«Ф = 2 (7) 

/ = 1 

Докажем линейность этого преобразования. Если 

*=2Ра 

і = і 

— любой другой вектор пространства, то 

п п 

(а + Ь) ф = 2 («,• + Р,) «,* ф = 2 (а,- + Р,) с,. = 

д=і і=і 

— 2 а , с < + 2 Р;С г = аф + *ф. . 

І =1 1=1 

Если же у — любое число, то 

(у а) ф = 2(ѵ а,) в, ф= 2 (уа,)с,. = у 2а(С« = у(аф). 

. 1=1 4 І = 1 ! = 1 

Что же касается справедливости равенств (6), то она вытекает из 
определения (7) преобразования ф, так как все координаты вектора е і 
в базе (4) равны нулю, кроме і-й координаты, равной единице. 

Нами установлено, следовательно, взаимно однозначное соот- 
ветствие между всеми линейными преобразованиями линейного 
пространства Ѵ п и всеми упорядоченными системами (5) из п 
векторов этого пространства. 
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Всякий вектор с ; обладает, однако, определенной записью в базе (4), 

с* =2 «,7 е /, /=1, 2, (8) 

1=і 

Из координат вектора с,- в базе (4) можно составить квадратную 
матрицу 

Л=(а и ), ( 9 ) 

беря в качестве ее і-й строки строку координат вектора с,-, г = 1,2, ... 

. . . , п. Так как система (5) была произвольной, то матрица А будет 
произвольной квадратной матрицей порядка п с действительными 
элементами. 

Мы имеем , таким образом, взаимно однозначное соответ- 
ствие между всеми линейными преобразованиями пространства Ѵ п 
и всеми квадратными матрицами порядка п\ это соответствие 
зависит, конечно, от выбора базы (4). 

Будем говорить, что матрица А задает линейное преобразова- 
ние ф в базе (4), или, короче, что А есть матрица линейного пре- 
образования ф в базе (4). Если через еф мы обозначим столбец, 
составленный из образов векторов базы (4), то из (6), (8) и (9) вытекает 
следующее матричное равенство, полностью описывающее связи, 
существующие между линейным преобразованием ф, базой е и 
матрицей А, задающей это линейное преобразование в этой базе: 

еср — Ае. (10) 

Покажем, как, зная матрицу А линейного преобразования ф 
в базе (4), по координатам вектора а в этой базе найти координаты 
его образа аф. Если 

а = 2 
/=1 
ТО 

Яф = 2 «,■ (е,-ф), 

* = 1 

что равносильно матричному равенству 

аф = (а ь а. 2 , ... ,а п ) (еф). 

Используя (10) и учитывая, что ассоциативность умножения матриц 
легко проверяется и в том случае, когда одна из матриц является 
столбцом, составленным из векторов, мы получаем: 

аф = [(«!, а 2 , ... ,а„М]е. 

Отсюда следует, что строка координат вектора аф равна строке 
координат вектора а, умноженной справа на матрицу А линей- 
ного преобразования ф, все в базе (4). 
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Пример. Пусть в базе е ѵ е 2 , е 3 трехмерного 
линейное преобразование ф задается матрицей 

/—2 1 Ох 

А= 1 3 2 

\ 0 — 4 Ь 

Если 


то 


(5, 1. -2) 


а=5е 1 + е і —2е 3 . 


■2 10 
1 3 2 

0 —4 1 


■ 9 , 


линейного пространства 


16, 0), 


аф = — 9йі+ 16е 2 . 


Связь между матрицами линейного преобразования в разных 
базах. Само собою разумеется, что матрица, задающая линейное 
преобразование, зависит от выбора базы. Покажем, какова связь 
между матрицами, задающими в разных базах одно и то же линей- 
ное преобразование. 

Пусть даны базы е и е с матрицей перехода Т, 

е'=Те, (11) 

и пусть линейное преобразование ср задается в этих базах соот- 
ветственно матрицами А и А', 

еф — Ае, е'<р — А'е'. (12) 


Второе из равенств (12) приводит, ввиду (11), к равенству 


Однако 


(Те)<р = А' (Те). 
(Те) ф = Г (еф). 


Действительно, если (т, 1( т (2 , , т іп ) — /-я строка матрицы Г, то 


(т п «х + т і2 е 2 + . . . + х іп е„) ф = Х п (е х ф) + т і2 (е 2 ф) + 


-*іп (е„ф). 


Таким образом, ввиду (12), 

(Те) ф = Т (еф) = Т (Ае) = (ТА) е, 

А’ (Те) = (А'Т) е, 

т. е. 

(ТА) е — (А'Т) е. 

Если хотя бы для одного і, 1 ^і^п, і - я строка матрицы ТА будет 
отлична от і- й строки матрицы А'Т, то две различные линейные 
комбинации векторов е 1 , е 2 , . . . , е п окажутся равными друг Другу, 
что противоречит линейной независимости базы е. Таким образом, 

ТА— А'Т, 
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откуда, ввиду невырожденности матрицы перехода Т, 

А'^ТАТ- 1 , А = Т~ 1 А'Т. (13) 

Заметим, что квадратные матрицы В и С называются подобными, 
если они связаны равенством 


где ф — некоторая невырожденная матрица. При этом говорят, что 
матрица С получена из матрицы В трансформированием матрицей <2. 

Доказанные выше равенства (13) можно сформулировать, таким 
образом, в виде следующей важной теоремы: 

Матрицы , задающие одно и то же линейное преобразование 
в разных базах, подобны между собой. При этом матрица линей- 
ного преобразования ф в базе е' получается трансформированием 
матрицы этого преобразования в базе е матрицей перехода от 
базы е' к базе е. 

Подчеркнем, что если матрица А задает линейное преобразова- 
ние ф в базе е, то любая матрица В , подобная матрице А, 

В=С}- Мф, 

также задает преобразование <р в некоторой базе, а именно в базе, 
получающейся из базы е при помощи матрицы перехода і}" 1 . 

Операции над линейными преобразованиями. Сопоставляя каж- 
дому линейному преобразованию пространства Ѵ п его матрицу в 
фиксированной базе, мы получаем, как доказано, взаимно одно- 
значное соответствие между всеми линейными преобразованиями 
и всеми квадратными матрицами порядка п. Естественно ожидать, 
что операциям сложения и умножения матриц, а также умножения 
матрицы на число, будут соответствовать аналогичные операции 
над линейными преобразованиями. 

Пусть в пространстве Ѵ„ даны линейные преобразования ф и ф. 
Назовем суммой этих преобразований преобразование ффф, опре- 
деляемое равенством 

а(ф + ф) = аф + аф; (14) 

оно переводит, следовательно, любой вектор а в сумму его образов 
при преобразованиях ф и ф. 

Преобразование ф ф ф является линейным. Действительно, для 
любых векторов а и Ь и любого числа а 

(а ф Ь) (ф ф ф) = (а ф Ь) ф + (а + Ь ) ф= 

= аф + Ьср ф аф + #Ф = а (ф ф ф) ф Ь (ф ф ф); 

(аа) (ф + ф) = (ай) ф -|- (ап) ф = а (йф) ф а (аф) = 

— а (йф ф аф) = а [а (ф ф ф)]. 
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С другой стороны, назовем произведением линейных преобразо- 
ваний ф и ф преобразование фф, определяемое равенством 

а (фф) = (аф) ф, (15) 

т. е. получающееся в результате последовательного выполнения 
преобразований ф и ф. 

Преобразование фф является линейным : 

(а + Ь) (фф) = [{а + Ь) ф] ф = (аф + (кр) ф = 

= (йф) ф + (Ьц>) ф = а (фф) 4- Ь (фф); 
(ап) (фф) = [(аа) ф] ф = [а (аф)] ф = а [(аф) ф] = а [а (фф)]. 

Назовем, наконец, произведением линейного преобразования ф 
на число к преобразование Хф, определяемое равенством 

а(хф) = х(аф); (16) 

образы при преобразовании ф всех векторов умножаются, следова- 
тельно, на число х. 

Преобразование хф является линейным'. 

(а + Ь) (хф) = х [(а ф- Ь) ф] = х (аф 4- &р) = 

= х (аф) ф- х (&р) =а (хф) 4- Ъ (хф); 
(аа) (хф) = х [(аа) ф] = х [а (аф) ] = а [х (аф) ] = а [а (хф) ] . 

Пусть в базе е ъ е 2 , . . . , е п преобразования ф и ф задаются 
соответственно матрицами А=(а і] ) и В = (р,у), 

еф = Ае, еф = Ве. 

Тогда, ввиду (14), 

«/ (Ф + Ф) = «,ф + = 2« и е ] + 2 Р,у«/ = 2 (а,-/ + Р«у) «у, 

I - 1 7=1 7=1 

т. е. 

е (ф ф) = (А 4- В) е. 

Таким образом, матрица суммы линейных преобразований 
в любой базе равна сумме матриц этих преобразований в той же 
базе. 

С другой стороны, ввиду (15), 

«; (<И>) = («,ф) Ф==( 2 <*,у« /) Ф = 2 «7/ («уФ) = 

- 1 Ц <ѵ*) - ж ( ,1 “**) **• 

т. е, 

е (фф) = ( АВ ) е. 
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Иными словами, матрица произведения линейных преобразований 
в любой базе равна произведению матриц этих преобразований 
в той же базе. 

Наконец, ввиду (16), 

П п 

е { И>) = х (е,ф) = х Е а и е і= 2 (*«,/) е ; > 

/= і /=і 

т. е. 

е (хф) = (нА) е. 

Следовательно, матрица, задающая в некоторой базе произве- 
дение линейного преобразования ф на число х, равна произведе- 
нию матрицы самого преобразования ф в этой базе на число %. 

Из полученных результатов следует, что операции над линей- 
ными преобразованиями обладают теми же свойствами, что и опе- 
рации над матрицами. Так, сложение линейных преобразований 
коммутативно и ассоциативно, а умножение ассоциативно, но при 
л>>1 не коммутативно. Для линейных преобразований существует 
однозначное вычитание. Отметим также, что тождественное 
преобразование е играет среди линейных преобразований роль 
единицы, а нулевое преобразование со — роль нуля. Действительно, 
в любой базе преобразование е задается единичной матрицей, а 
преобразование <о — нулевой матрицей. 

§ 32*. Линейные подпространства 

Подмножество Л линейного пространства V называется линей- 
ным подпространством этого пространства, если оно само является 
линейным пространством по отношению к определенным в V 
операциям сложения векторов и умножения вектора на число. 
Так, в трехмерном евклидовом пространстве совокупность векто- 
ров, выходящих из начала координат и лежащих на некоторой 
плоскости (или некоторой прямой), проходящей через начало, будет 
линейным подпространством. 

Для того чтобы непустое подмножество I пространства 
V было его линейным подпространством, достаточно выполнения 
следующих требований: 

1. Если векторы а и Ь принадлежат к Л, то в Л содержится 
и вектор а-\-Ь. 

2. Если вектор а принадлежит к Л, то в Л содержится 
и вектор аа при любом значении числа а. 

Действительно, ввиду условия 2, множество Л содержит нулевой 
вектор: если вектор а принадлежит к і, то Л содержит и век- 
тор 0-а = 0. Далее, Л вместе со всяким своим вектором а содер- 
жит, снова ввиду свойства 2, и противоположный ему вектор 
— а = ( — 1 ) - а, а поэтому ввиду свойства 1 к Л принадлежит 
и разность любых двух векторов из Л. Что же касается всех остальных 
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требований, входящих в определение линейного пространства, то 
они, выполняясь в V, будут выполняться и в I. 

Примерами линейных подпространств пространства V могут 
служить само пространство V, а также множество, состоящее из 
одного нулевого вектора, — так называемое нулевое подпростран- 
ство. Более интересен следующий пример: берем в пространстве V 
любую конечную систему векторов 

® 1 » ®2і • * • і а г 0) 

и обозначаем через і множество всех тех векторов, которые 
являются линейными комбинациями векторов (1). Докажем, что /. 
будет линейным подпространством. В самом деле, если 

Ь = а 1 а 1 + а 2 а 2 + . . . + а г а г , с— р 1 а 1 р 2 а 2 + . . . + 
то 

Ь + с = (а А + Р А ) а х + (а 2 + Р 2 ) а 2 (а А + Р г ) а г , 

т. е. вектор Ь-\- с принадлежит к I; к I принадлежит и вектор 
уЬ = (уаД а х + (Ѵ« 2 > а 2 + • • • + №,) а г 
при любом числе у. 

Говорят, что это линейное подпространство I порождено систе- 
мой векторов (1); к I принадлежат, в частности, сами векторы (1). 

Впрочем, всякое линейное подпространство конечномерного 
линейного пространства порождается конечной системой век- 
торов , так как если оно не является нулевым, то обладает даже 
конечной базой. Размерность линейного подпространства Ь не больше 
размерности п самого пространства Ѵ п , причем равна п лишь при 
I = Ѵ п . Размерностью нулевого подпространства следует считать, 
конечно, число 0. 

Для всякого к , 0 < к < я, в пространстве Ѵ п существуют 
линейные подпространства размерности к — достаточно взять 
подпространство, порожденное любой системой из к линейно 
независимых векторов. 

Пусть в пространстве V даны линейные подпространства Ь х и І 2 . 
Совокупность І 0 векторов, принадлежащих как к Р х , так и к Ь г , 
будет, как легко проверить, линейным подпространством; оно на- 
зывается пересечением подпространств и Т, 2 . С другой стороны, 
линейным подпространством будет и сумма І подпространств Ь х и І 2 , 
т. е. совокупность всех тех векторов из V, которые представимы 
в виде суммы двух слагаемых, одного из Л х , другого из Если 
размерности подпространств і 2 , і 0 и І суть, соответственно, 
й х , и д, то имеет место следующая формула; 


й — й х + й ? 0 , 


(2) 
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§ 321 


т. е. размерность суммы двух подпространств равна сумме 
размерностей этих подпространств минус размерность их пере- 
сечения. 

Для доказательства берем произвольную базу 





^1? ^2» 

• • * » а а 0 

(3) 

подпространства 

Т-о 

и дополняем 

ее до базы 



°і. 

° 2 . 

• • • > а а 0 < 

^а 0 +і> •••> 

(4) 

подпространства 

7-г 

и до 

базы 




«і- 

«2. 

• • • > 

с а„+і> •••* с а. 

(5) 


подпространства /,. 2 . Легко видеть, используя определение подпро- 
странства 7., что это подпространство порождается системой век- 
торов 

а. | , а. , I,,, а ^ , 6 . ^ , , , , , д ^ , с ^ , , , , , , с ^ > і ( ) | 

Формула (2) будет, следовательно, доказана, если мы докажем ли- 
нейную независимость системы (6). 

Пусть имеет место равенство 

а іДі + ®2 а 2+ ••• +«а 0 а а а + Ра 0 +і & д в +і + • • • +Р<А + 

-ЬУао+х^+і + • • • +'Ѵа, с а,~° 
с некоторыми числовыми коэффициентами. Тогда 
д=а 1 а 1 4- «а а 2 . . . + + Ра „ + 1 + 1 + ••« + 0*^,= 

= — Ѵао+іЧ+і— •••— (7) 

Левая часть этого равенства содержится в і 1 , правая — в Т, 2 , по- 
этому вектор д, равный как левой, так и правой части этого ра- 
венства, принадлежит к 7. 0 и, следовательно, линейно выражается 
через базу (3). Правая часть равенства (7) показывает, однако, 
что вектор д линейно выражается и через векторы с а +1 , с а 
Отсюда, ввиду линейной независимости системы (5), вытекает, что 
все коэффициенты Ѵ^ 0 +і, .... Уа 2 равны нулю, т. е. д—0, а тогда, 
ввиду линейной независимости системы (4), все коэффициенты 
<%, а а , Ра„+і’ •••> Ра, также равны нулю. Этим доказана 
линейная независимость системы (6). 

Читателю предлагается проверить, что наше доказательство 
сохраняет силу и в том случае, когда подпространство Ь 0 явля- 
ется нулевым, т. е. д 0 =0. 

Область значений и ядро линейного преобразования. Пусть в 
линейном пространстве Ѵ п задано линейное преобразование ср. Если 
I — любое линейное подпространство пространства Ѵ п , то сово- 
купность іф образов всех векторов из І при пре- 
образовании ф также будет линейным подпрост- 
ранством, как немедленно вытекает из определений линейного 
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подпространства и линейного преобразования. В частности, линей- 
ным подпространством будет и совокупность Ѵ п ц> образов всех 
векторов пространства она называется областью значений 

преобразования ф. 

Найдем размерность области значений. Для этого заметим, что 
так как все матрицы, задающие преобразование ф в разных базах, 
подобны между собой, то, ввиду последней теоремы из § 14, все 
они имеют один и тот же ранг. Это число можно назвать, следо- 
вательно, рангом линейного преобразования ф. 

Размерность области значений линейного преобразования ф 
равна рангу этого преобразования. 

В самом деле, пусть ф задается в базе е 1г е 2 , е п матри- 

цей А. Подпространство Ѵ п ц> порождается векторами 

*іФ, <УР> •••. ( 8 ) 

и поэтому базой подпространства Ѵ п ц> будет служить, в частности, 
любая максимальная линейно независимая подсистема системы (8). 
Однако максимальное число линейно независимых векторов в си- 
стеме (8) равно максимальному числу линейно независимых строк 
матрицы А, т. е. равно рангу этой матрицы. Теорема доказана. 

Мы знаем, что при линейном преобразовании ф нулевой вектор 
переходит в самого себя. Совокупность Л/(ф) всех векторов про- 
странства Ѵ п , отображающихся при ф в нулевой вектор, будет, 
следовательно, непустой и является, очевидно, линейным подпро- 
странством. Это подпространство называется ядром преобразова- 
ния ф, а его размерность — дефектом этого преобразования. 

Для любого линейного преобразования ф пространства Ѵ п 
сумма ранга и дефекта этого преобразования равна размерно- 
сти п всего пространства. 


Действительно, 

если г — ранг преобразования ф, 

то подпро- 

странство Ѵ п ср обладает базой из г векторов 



^1» • • • 1 ^ г* 

( 9 ) 

В пространстве Ѵ п 

можно выбрать такие векторы 



Ь Хі Ь 2 , . . . , Ь Г , 

(10) 

что 

% 

II 

? 

Ю 

•ч 



выбор векторов (10) не является, понятно, однозначным. Если бы 
некоторая нетривиальная линейная комбинация векторов (10) ото- 
бражалась преобразованием ф в нуль, в частности, если бы векторы 
(10) были линейно зависимыми, то векторы (9) оказались бы сами 
линейно зависимыми против предположения. Поэтому линейное под- 
пространство порожденное векторами (10), имеет размерность 
г, а его пересечение с подпространством ф) равно нулю. 
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С другой стороны, сумма подпространств Ь и ІѴ(ф) совпадает 
со всем пространством Ѵ п . Действительно, если с — любой вектор 
пространства, то вектор й = с<р принадлежит, конечно, к подпро- 
странству И п ф. Тогда в подпространстве А найдется такой век- 
тор Ь, что 

Ь ф = й 

— вектор Ь записывается через систему (10) с теми же коэффи- 
циентами, с какими вектор й записывается через базу (9). Отсюда 

с = й + (с — Ь), 

причем вектор с — Ь содержится в подпространстве іѴ(ф), так как 
(с — Ь) ф=сф — Ьу—сі— <1=0. 

Из полученных результатов и доказанной выше формулы (2) 
вытекает утверждение теоремы. 

Невырожденные линейные преобразования. Линейное преобра- 
зование ф линейного пространства Ѵ п называется невырожденным , 
если оно удовлетворяет любому из следующих условий, равносиль- 
ность которых немедленно вытекает из доказанных выше теорем: 

1. Ранг преобразования ф равен п. 

2. Областью значений преобразования ф служит 
все пространство Ѵ п . 

3. Дефект преобразования ф равен нулю. 

Для невырожденных линейных преобразований можно указать 
также много других определений, равносильных указанным выше, 
в частности определения 4 — 6. 

4. Различные векторы пространства Ѵ п имеют 
при преобразовании ф различные образы. 

Действительно, если преобразование ф обладает свойством 4, 
то ядро этого преобразования состоит лишь из нулевого вектора, 
т. е. выполняется и свойство 3. Если же векторы а и Ь таковы, 
что афЬ , но аф = 6ф, то а — Ьф 0, но (а — Ь) ф=0, т. е. свой- 
ство 3 не выполняется. 

Из 2 и 4 вытекает 

5. Преобразование ф является взаимно одно- 
значным отображением пространства Ѵ п на все это 
пространство. 

Из 5 следует, что для невырожденного линейного преобразо- 
вания ф существует обратное преобразование ф -1 , переводящее 
всякий вектор аф в вектор а, 

(аф)ф -1 = а. 

Преобразование ф -1 будет линейным, так как 

(аф + &ф)ф _1 = [(а + &)ф]ф -1 =а + й, 

[а (аф)]ф “ 1 = [(сха)ф] ф " 1 = аа. 
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Из определения преобразования ф -1 вытекает, что 

фф-^ф-іф^е; (П) 

равенства (11) могут сами рассматриваться как определение обрат- 
ного преобразования. Отсюда и из последних результатов пред- 
шествующего параграфа следует, что если невырожденное линей- 
ное преобразование ф задается в некоторой базе матрицей А, 
невырожденной ввиду свойства 1, то преобразование ф -1 зада- 
ется в этой базе матрицей Л -1 . 

Мы приходим, таким образом, к следующему определению не- 
вырожденного линейного преобразования: 

6. Для преобразования ф существует обратное 
линейное п р е о б р а з о в а н и е ф -1 . 


§ 33. Характеристические корни 
и собственные значения 


Пусть Л = (а [ у) — квадратная матрица порядка л с действитель- 
ными элементами. Пусть, с другой стороны, Я — некоторое неиз- 
вестное. Тогда матрица Л— ЯД, где Е— единичная матрица по- 
рядка я, называется характеристической матрицей матрицы А. 
Так как в матрице ХЕ по главной диагонали стоит X, все же 
остальные элементы равны нулю, то 


А—ХЕ=\ 


®п — Я Юц 

• • • «1» 

а 21 

^22 

... а щ 

а п1 

а«а 

• • * &ПП ^ 


Определитель матрицы А — ХЕ будет многочленом от Я, притом 
степени я. В самом деле, произведение элементов, стоящих на 
главной диагонали, будет многочленом от Я со старшим членом 
( — 1)"Я”, все же остальные члены определителя не содержат по 
меньшей мере двух из числа элементов, стоящих на главной диа- 
гонали, и поэтому их степень относительно Я не превосходит 
л — 2. Коэффициенты этого многочлена можно было бы легко найти. 
Так, коэффициент при Я"- 1 равен ( - 1)"-і (а 1г + а 2г + ... . +а пп ), 
а свободный член совпадает с определителем матрицы А. 

Многочлен я-й степени | А — ХЕ\ называется характеристиче- 
ским многочленом матрицы А, а его корни, которые могут быть 
как действительными, так и комплексными, называются характе- 
ристическими корнями этой матрицы. 

Подобные матрицы обладают одинаковыми характеристи- 
ческими многочленами и, следовательно, одинаковыми характе- 
ристическими корнями. 
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Пусть, в самом деле, 

В^О-'АС). 


Тогда, учитывая, что матрица %Е перестановочна с матрицей С, }, 
а |С“ 1 |==|ОГ 1 , получаем: 

\В— ХЕ| = |<ГМ<г — ХЕІНЗ- 1 ^— ХЕ)р| = 
что и требовалось доказать. 

Из этого результата вытекает, ввиду доказанной в § 31 тео- 
ремы о связи между матрицами, задающими линейное преобразо- 
вание в разных базах, что хотя линейное преобразование <р мо- 
жет задаваться в разных базах различными матрицами, однако 
все эти матрицы имеют один и тот же набор характеристи- 
ческих корней. Эти корни можно называть поэтому характеристи- 
ческими корнями самого преобразования <р. Весь набор этих ха- 
рактеристических корней, причем каждый корень берется с той 
кратностью, какую он имеет в характеристическом многочлене, 
называется спектром линейного преобразования <р. 

Характеристические корни играют при изучении линейных пре- 
образований очень большую роль. Читатель много раз будет иметь 
возможность в этом убедиться. Одно из применений характе- 
ристических корней мы сейчас укажем. 

Пусть в действительном линейном пространстве Ѵ п задано ли- 
нейное преобразование ф. Если вектор Ь, отличный от нуля, пере- 
водится преобразованием ф в векгтор, пропорциональный самому Ь, 

Ь<р=% 0 Ь, (1) 

где Х 0 — некоторое действительное число, то вектор Ь называется 
собственным вектором преобразования ф, а число А. 0 — собствен- 
ным значением этого преобразования, причем говорят, что соб- 
ственный вектор Ь относится к собственному значению >„ 0 . 

Заметим, что так как Ьф 0, то число % 0 , удовлетворяющее 
условию (1), определяется для вектора Ь однозначно. Подчеркнем, 
далее, что нулевой вектор не считается собственным вектором 
преобразования ф, хотя он удовлетворяет условию (1), притом для 
любого Х 0 . 

Вращение евклидовой плоскости вокруг начала координат на 
угол, не являющийся кратным я, служит примером линейного пре- 
образования, не имеющего собственных векторов. Примером дру- 
гого крайнего случая является растяжение плоскости, при котором 
все векторы, выходящие из начала координат, растягиваются, ска- 
жем, в пять раз. Это будет линейное преобразование, причем все 
ненулевые векторы плоскости будут для него собственными; все 
они относятся к собственному значению 5. 
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Действительные характеристические корни линейного пре- 
образования ф, если они существуют, и только они служат 
собственными значениями этого преобразования. 

Пусть, в самом деле, преобразование ф имеет в базе е 1г е 2 , . . е п 
матрицу А — (а {] ) и пусть вектор 

/=1 

является собственным векторе м преобразования ф, 

( 2 ) 

Как доказано в § 31, 


[(Эх, Р 2 , •••, РяМ I е - ( 3 ) 


Равенства (2) и (3) приводят к системе равенств 


Рі«п + Р 2 « 2 і + • • • + Рп«лі = ^оРі> 

Рі«12 + $2«22 + . . . + Р л а л2 *=Л 0 Р 2 , (4) 


Рі«1я + р2« 2 „ +•••■+ Ря«лл — ^1)Рл- 

Так как Ьф 0, то не все числа |3 2 , Р„ равны нулю. Таким 
образом, ввиду (4), система линейных однородных уравнений 

(Кп-У-Ь 4- «21*2+ ■••+“„Л = 0, 

= « 12 * 1 + («22 — &<>)*,+ • • • + «« 2 *„ = 0 , 

(5) 

а 1п Хі+а 2и х 2 + . . . + [сс пп — Л 0 ) ,ѵ„=0 

обладает ненулевым решением, а поэтому ее определитель равен 
нулю, 

а 11 ^0, «21» • • • > «ЯІ 

«1 2 І «22 ^”0» •••> «я 2 

«1я» «2я» «ня ^0 

Транспонируя, получаем 

ІА-Ь 0 Е\ = О, (7) 

т. е. собственное значение Я 0 на самом деле оказалось характери- 
стическим корнем матрицы А и, следовательно, линейного преоб- 
разования ф, притом, понятно, действительным. 

Обратно, пусть Я 0 будет любым действительным характеристи- 
ческим корнем преобразования ф и, следовательно, матрицы А. 
Тогда имеет место равенство (7), а поэтому и получающееся из 
него транспонированием равенство (6). Отсюда следует, что система 
линейных однородных уравнений (5) обладает ненулевым решением, 
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притом даже действительным, так как все коэффициенты этой 
системы действительны. Если это решение обозначим через 

(Рх, Р-), (8) 

то имеют место равенства (4). Обозначим через Ь вектор про- 
странства Ѵ п , имеющий в базе е и е 2 , е п строку координат 

(8); ясно, что Ьф 0. Тогда справедливо равенство (3), а из (4) 
и (3) следует (2). Вектор Ь оказался, таким образом, собствен- 
ным вектором преобразования ср, относящимся к собственному зна- 
чению Я 0 . Теорема доказана. 

Заметим, что если бы мы рассматривали комплексное линей- 
ное пространство, то требование действительности характеристиче- 
ского корня было бы излишним, т. е. была бы доказана теорема: 
характеристические корни линейного преобразования комплекс - 
кого линейного пространства и только они служат собствен- 
ными значениями этого преобразования. Отсюда следует, что 
в комплексном линейном пространстве всякое линейное преоб- 
разование обладает собственными векторами. 

Возвращаясь к рассматриваемому нами действительному слу- 
чаю, отметим, что совокупность собственных векторов линейного 
преобразования <р, относящихся к собственному значению ^, 0 , сов- 
падает с совокупностью ненулевых действительных решений систе- 
мы линейных однородных уравнений (5). Отсюда следует, что со- 
вокупность собственных векторов линейного преобразования ф, 
относящихся к собственному значению А 0 , будет, после добав- 
ления к ней нулевого вектора, линейным подпространством про- 
странства Ѵ п . В самом деле, из доказанного в § 12 вытекает, 
что совокупность (действительных) решений любой системы ли- 
нейных однородных уравнений от п неизвестных будет линей- 
ным подпространством пространства Ѵ п . 

Линейные преобразования с простым спектром. Во многих слу- 
чаях оказывается необходимым знать, может ли данное линейное 
преобразование ф иметь в некоторой базе диагональную мат- 
рицу. На самом деле далеко не всякое линейное преобразование 
может быть задано диагональной матрицей. Необходимые и доста- 
точные условия для этого будут указаны в §61, а сейчас мы хотим 
привести одно достаточное условие. 

Докажем сначала следующие вспомогательные результаты: 

Линейное преобразование ф тогда и только тогда задается 
в базе е г , е г , ..., е п диагональной матрицей, если все векторы 
этой базы являются собственными векторами преобразования ф. 

Действительно, равенство 

*/ф=Ѵ* 

равносильно тому, что в і- й строке матрицы, задающей преобра- 
зование ф в указанной базе, равны нулю все элементы, стоящие 
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вне главной диагонали, а на главной диагонали (т. е. на 1-м месте) 
стоит число Я,-. 

Собственные векторы Ь г , Ь%, Ь к линейного преобразова- 

ния ф, относящиеся к различным собственным значениям, со- 
ставляют линейно независимую систему. 

Будем доказывать это утверждение индукцией по к, так как 
при к — \ оно справедливо — один собственный вектор, будучи 
отличным от нуля, составляет линейно независимую систему. Пусть 

Ьіу—кіЬ, і'=1, 2, 
и 

Я рф-'к) при і ф }, 

Если существует линейная зависимость 

а А + «А + ... + аА=°, ( 9 ) 

где, например, а^О, то, применяя к обеим Частям равенства (9) 
преобразование ф, получим 

Вычитая отсюда равенство (9), умноженное на Я А , получаем 

а 1 (^1 — ^к) + (Я 2 — Я А ) Ь г -\- . . . -}-а А _ 1 О^к - 1 — Я*) &А_ 1 = 0, 

что дает нетривиальную линейную зависимость между векторами 
Ь ѵ Ь 2 , .... Ьк-ц так как а х (Я^ Я А ) Ф 0. 

Говорят, что линейное преобразование ф действительного линей- 
ного пространства Ѵ п имеет простой спектр, если все его харак- 
теристические корни действительны и различны. Преобразование 
ф имеет, следовательно, п различных собственных значений, а по- 
этому, по доказанной теореме, в пространстве Ѵ„ существует база, 
составленная из собственных векторов этого преобразования. Та- 
ким образом, всякое линейное преобразование с простым спект- 
ром может быть задано диагональной матрицей. 

Переходя от линейного преобразования к матрицам, его задаю- 
щим, мы получаем следующий результат: 

Всякая матрица, все характеристические корни которой 
действительны и различны, подобна диагональной матрице или, 
как говорят, такая матрица приводится к диагональному виду. 



ГЛАВА ВОСЬМАЯ 

ЕВКЛИДОВЫ ПРОСТРАНСТВА 

§ 34. Определение евклидова пространства. 

Ортонормированные базы 

Понятие л-мерного линейного пространства далеко не в полной 
мере обобщает понятия плоскости или трехмерного евклидова про- 
странства — в л-мерном случае при л>3 не определены ни длина 
вектора, ни угол между векторами, и поэтому невозможно разви- 
тие той богатой геометрической теории, которая хорошо знакома 
читателю для п— 2 и л = 3. Оказывается, что положение может 
быть исправлено, притом следующим путем. 

Из курса аналитической геометрии известно, что и в плоскости, 
и в трехмерном пространстве можно ввести понятие скалярного 
умножения векторов. Оно определяется при помощи длин векто- 
ров и угла между ними, но, как оказывается, и длина вектора, 
и угол между векторами в свою очередь могут быть выражены 
через скалярные произведения. Мы определим поэтому в любом 
л-мерном линейном пространстве понятие скалярного умножения, 
причем определим аксиоматически, при помощи некоторых свойств, 
которыми, как хорошо известно, скалярное умножение векторов 
плоскости или трехмерного пространства на самом деле обладает. 
При этом, учитывая те непосредственные цели, ради которых этот 
раздел включен в курс высшей алгебры, вводить определения 
длины вектора и угла между векторами мы не станем. Читателя, 
интересующегося построением геометрии в я-мерных пространст- 
вах, мы отсылаем к специальной литературе, в первую очередь 
к более полным книгам по линейной алгебре. 

Отметим, что всюду в этой главе, кроме конца настоящего па- 
раграфа, рассматриваются действительные линейные прост- 
ранства. 

Будем говорить, что в я-мерном действительном линейном про- 
странстве Ѵ п определено скалярное умножение, если всякой паре 
векторов а, Ь поставлено в соответствие действительное число, 
обозначаемое символом (а, Ь) и называемое скалярным произведе- 
нием векторов а и Ь, причем выполняются следующие условия 
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(здесь а , Ь, с — любые векторы пространства Ѵ п , а — любое дейст- 
вительное число): 

I. (а, Ь) = (Ь, а). 

Н. (а + Ь, с)~(а, с) + (Ь, с). 

III. (а а, Ь) = а (а, Ь). 

IV. Если аф 0, то скалярный квадрат вектора а строго поло- 
жителен, 

(а, а) > 0. 

Отметим, что из III при а=0 следует равенство 

(0, Ь) = 0, (1) 

т. е. скалярное произведение нулевого вектора на любой вектор 
Ь равно нулю ; равен нулю, в частности, скалярный квадрат нуле- 
вого вектора. 

Из II и III немедленно вытекает следующая формула для 
скалярного произведения линейных комбинаций 
двух систем векторов: 

ь /)- ( 2 ) 

Ѵ = 1 і = 1 / 1=1 1=1 

Если в л-мерном линейном пространстве определено скалярное 
умножение, то это пространство называется л-мерным евклидовым 
пространством. 

При любом п в п-мерном линейном пространстве Ѵ п можно 
определить скалярное умножение , т. е. можно превратить это 
пространство в евклидово. 

В самом деле, возьмем в пространстве Ѵ п любую базу е 1 , 
е 2 , . .., е п . Если 

П П 

«=Х а ‘ е і> 

1=1 1=1 

то положим 

п 

(а, ( 3 ) 

і=і 

Легко проверяется, что условия I — IV будут выполнены, т. е. ра- 
венство (1) определяет в пространстве Ѵ п скалярное умножение. 

Мы видим, что в л-мерном линейном пространстве скалярное 
умножение можно задать, вообще говоря, многими различными 
способами — определение (3) зависит, понятно, от выбора базы, а 
мы пока не знаем, кроме того, нельзя ли ввести скалярное умно- 
жение и каким-либо принципиально иным способом. Нашей бли- 
жайшей целью является обозрение всех возможных способов пре- 
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вращения /2-мерного линейного пространства в евклидово простран- 
ство и установление того, что в некотором смысле для всякого п 
существует одно-единственное //-мерное евклидово пространство. 

Пусть дано произвольное //-мерное евклидово пространство Е п , 
т. е. в «-мерном линейном пространстве произвольным способом 
введено скалярное умножение. Векторы а и Ь называются орто- 
гональными, если их скалярное произведение равно нулю, 

{а, Ь) = 0. 

Из (1) следует, что нулевой вектор ортогонален к любому вектору; 
могут существовать, однако, и ненулевые ортогональные векторы. 

Система векторов называется ортогональной системой, если 
все векторы этой системы попарно ортогональны между собой. 

Всякая ортогональная система ненулевых векторов линей- 
но независима. 

Пусть, в самом деле, в Е п дана система векторов с 1 , а 2 , . . ., а А , 
причем а і Ф 0, 2=1,2, ...,к, и 

(а : , а-) = 0 при іф]. (4) 

Если 

«і а і +а 2 а 2 + а к а к = 0, 

то, скалярно умножая обе части этого равенства на вектор а { 
1^2^ к, получаем ввиду (1), (2) и (4): 

0 = (0, а>)=*{а х а х фа 2 а 2 + . . . +а ь а к , а ( ) = 

= а 1 (а 1 , а ( ) + а 2 (а 2 , а-)+ ...+а к (а к , а ( -) = <Х,- («„ а,). 

Отсюда, так как (а,-, а ( )>0 по IV, вытекает а,= 0, 2=1, 2, . .., к, 
что и требовалось доказать. 

Сейчас будет описан процесс ортогонализации, т. е. 
некоторый способ перехода от любой линейно независимой систе- 
мы из к векторов 

а 1, « 2 - •••> а к ( 5 ) 

евклидова пространства Е п к ортогональной системе, также состоя- 
щей из к ненулевых векторов; эти векторы будут обозначены че- 
рез ь х , ь 2 , ..., ъ к . 

Положим Ь х = а х , т. е. первый вектор системы (5) вой- 
дет и в строящуюся нами ортогональную систему. 
Положим, далее, 

Ь 2 ~<х х Ь х -}- о 2 . 

Так как Ь х = а х , а векторы а х и а 2 линейно независимы, то век- 
тор Ь 2 отличен от нуля при любом числе а х . Подберем это число 
из условия, что вектор Ь 2 должен быть ортогонален к вектору Ь х : 

0=(*і, = а 1 Ь 1 + а 2 )=а 1 (Ь 1 , Ь Х ) + (Ь Х , а 2 ), 
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откуда, ввиду IV, 


®1 


(Ьі, д а) 
(Ьг, Ь х )' 


Пусть уже построена ортогональная система ненулевых векто- 
ров Ь и Ь г ,..., Ьр, дополнительно предположим, что для всякого г, 
1 ^ ^ /, вектор Ь і является линейной комбинацией векторов а г , 
а 2 , ..., а ( .. Это предположение будет выполняться тогда и для 
вектора Ь 1+ѵ если он будет выбран в виде 

^+1 =0і 1^1+«2 & 2+ • • • + а А~Ь а 7 + 1- 


Вектор Ь иі будет при этом отличен от нуля, так как система (5) 
линейно независимая, а вектор а 1+1 не входит в записи векторов 
Ь и . . ., Ь[. Коэффициенты а ІУ і = 1, 2, . . ., /, подберем из усло- 
вия, что вектор Ь [+1 должен быть ортогонален ко всем векторам Ь ІУ 
/=1, 2, .... /: 

О — {&(, Ь [+1 ) — (Ь і , . . . + аД + <* г+1 ) = 

= а 1 (Ь 1 , Ь к ) -\-а 2 (Ь;, Ь 2 ) ф- . . , + а 2 (Ь { , «г+і); 


отсюда, так как векторы Ь ѵ Ь г , . . ., Ь 1 ортогональны между собой, 
«/(*<, Ьі) + (Ьі, а 2+1 ) = О, 

т. е. 


(Ьі, Дл-х) 
Фі, Ьі) ’ 


1= 1, 2, 


/. 


Продолжая этот процесс, мы построим искомую ортогональную 
систему Ь ъ Ь ІУ ..., Ь к . 

Применяя процесс ортогонализации к произвольной базе про- 
странства Е п , мы получим ортогональную систему из п ненулевых 
векторов, т. е., так как эта система по доказанному линейно не- 
зависима, ортогональную базу. При этом, используя замечание, 
сделанное в связи с первым шагом процесса ортогонализации, 
а также учитывая, что всякий ненулевой вектор можно включить 
в некоторую базу пространства, можно сформулировать даже сле- 
дующее утверждение: 

Всякое евклидово пространство обладает ортогональными 
базами, причем любой ненулевой вектор этого пространства 
входит в состав некоторой ортогональной базы. 

В дальнейшем важную роль будет играть один специальный вид 
ортогональных баз; базы этого вида соответствуют прямоугольным 
декартовым системам координат, используемым в аналитической гео- 
метрии. 

Назовем вектор Ь нормированным, если его скалярный квадрат 
равен единице, 

(Ь, Ь)= 1. 
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Если аф 0, откуда (а, а)> 0, то нормированием вектора а назы- 
вается переход к вектору 

Ь— г } а. 

V (а, а) 

Вектор Ь будет нормированным, так как 

Ь) ~(уфГа) а ’ У&ГТ) а ) = (Т&Ы) ^ ’ в)вІ * 

База е 1 , е 2 , е п евклидова пространства Е а называется орто- 
нормированной, если она ортогональна, а все ее векторы норми- 
рованы, т. е. 

(ві, е ; )=0 при іф), 

(а., е,) = 1, /=1, 2 л . 

Всякое евклидово пространство обладает ортонормирован- 
ными базами. 

Для доказательства достаточно взять любую ортогональную базу 
и нормировать все ее векторы. База останется при этом ортогональ- 
ной, так как при любых а и р из (а, Ь) = 0 следует 

(а а, р6)=оф(а, д) — 0. 

База е 1 , е 3 , ..., е п евклидова пространства Е п тогда 

и только тогда будет ортонормированной, если скалярное про- 
изведение любых двух векторов пространства равно сумме 
произведений соответственных координат этих векторов в ука- 
занной базе, т. е. из 

<=і /= і 

следует 

(в, &)=2 «/Рй ( 8 ) 

1 = 1 


Действительно, если для нашей базы выполняются равенства (6), то 

к *)=(2 а і е ь 2Р/ е Л= 2 «у)=2«/Р,-- 

Ѵ = І /=1 / С/=1 ' і = 1 


Обратно, если наша база такова, что для любых векторов о и Ь, 
записанных в этой базе в виде (7), справедливо равенство (8), то, 
беря в качестве а и Ь любые два вектора этой базы е г и е ) , раз- 
личные или одинаковые, мы из (8) выведем равенства (6). 

Сопоставляя полученный сейчас результат с изложенным ранее 
доказательством существования л-мерных евклидовых пространств 
для любого п, можно высказать следующее утверждение: если в 
п-мерном линейном пространстве Ѵ п выбрана произвольная база. 
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то в Ѵ п можно так задать скалярное умножение, что в полу- 
ченном евклидовом пространстве выбранная база будет одной 
из ортонормированных баз. 

Изоморфизм евклидовых пространств. Евклидовы простран- 
ства Е и Е' называются изоморфными , если между векторами этих 
пространств можно установить такое взаимно однозначное соответ- 
ствие, что выполняются следующие требования: 

1) это соответствие является изоморфным соответствием между 
Е и Е' , рассматриваемыми как линейные пространства (см. § 29); 

2) при этом соответствии сохраняется скалярное произведение; 
иными словами, если образами векторов а и Ь из Е служат соот- 
ветственно векторы а' и Ь' из Е', то 

(а, Ь)*={а', Ь'). (9) 

Из условия 1) сразу следует, что изоморфные евклидовы про- 
странства имеют одну и ту же размерность. Докажем обратное 
утверждение: 

Любые евклидовы пространства Ей Е ' , имеющие одну и ту 
же размерность п, изоморфны между собой. 

В самом деле, выберем в пространствах Е и Е' ортонорми- 
рованные базы 

е 2 , ..., е п (10). 

и, соответственно, 



Ставя в соответствие всякому вектору 

П 

а= 

из Е вектор 

а' = 2а^; 

из Е' , имеющий в базе (11) те же координаты, что и вектор а 
в базе (10), мы получим, очевидно, изоморфное соответствие между 
линейными пространствами Е и Е' . Покажем, что выполняется 
и равенство (9): если 

ь=%$ і е і ,ь'= 2м;. 

г=і і= \ 

то, в силу (8) — учесть ортонормированность баз (10) и (11)!-— 
(а, 6)=2сс ; р,. = (а\ Ь'). 

і = і 

Естественно изоморфные евклидовы пространства не считать раз- 
личными. Поэтому для всякого п существует единственное л-мерное 
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евклидово пространство в том же смысле, в каком для всякого п 
существует единственное л-мерное действительное линейное про- 
странство. 

На случай комплексных линейных пространств понятия и резуль- 
таты настоящего параграфа переносятся следующим образом. Комплексное 
линейное пространство называется унитарным пространством, если в нем 
задано скалярное умножение, причем (а, Ь) будет, вообще говоря, комплекс- 
ным числом; при этом должны выполняться аксиомы II — IV (в формули- 
ровке последней аксиомы следует подчеркнуть, что скалярный квадрат не- 
нулевого вектора действителен и строго положителен), а аксиома I заме- 
няется аксиомой 

I' (а, Ь) = (ЬТа), 

где черта обозначает, как обычно, переход к сопряженному комплексному 
числу. 

Скалярное умножение уже не будет, следовательно, коммутативным. 
Тем не менее, равенство, симметричное аксиоме II, остается справедливым, 

II' (а, Ь + с) = (а, Ь) + (а, с), 

так как 

(а, Ь + с) — (Ь + с, а) — {Ь, п) + (с, а) = (Ь, о) + (с, а)=>(а, Ь) + (а, с). 

С другой стороны, 

III' (а, аЬ)=а (а, Ь), 

так как 

(а, аЬ)=(аЬ, а)—а (Ь, а) — а(Ь, а) = а(а, *). 

Понятия ортогональности н ортонормированной системы векторов пере- 
носятся на случай унитарных пространств без всяких изменений. Как и 
выше, доказывается существование ортонормированных баз во всяком ко- 
нечномерном унитарном пространстве. При этом, однако, если е 1( е г , .... е п — 
ортонормированная база и векторы а , Ь имеют в этой базе записи (7), то 

(з. Ь) = 2 
1=1 

Результаты дальнейших параграфов настоящей главы также можно было 
бы перенести с евклидовых на унитарные пространства. Мы не будем этого 
делать и отошлем интересующегося читателя к специальным книгам по 
линейной алгебре. 

§ 35. Ортогональные матрицы, ортогональные преобразования 

Пусть дано действительное линейное преобразование п неиз- 
вестных: 

П 

•*«•= 2 ЧаУ» '= !. 2 . •••. К (1) 

к = 1 

матрицу этого преобразования обозначим через С}. Это преобразова- 
ние переводит сумму квадратов неизвестных х г , х $ , х п , т. е. 
квадратичную форму я® +х\+ ... являющуюся нормальным 
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видом положительно определенных квадратичных форм (см. § 28), 
в некоторую квадратичную форму от неизвестных^, _у 2 , у п . 
Случайно эта новая квадратичная форма сама может оказаться сум- 
мой квадратов неизвестных у 1У у г , . . ., у п , т. е. может иметь место 
равенство 

ХІ+К + ---+К=УІ+УІ + ---+УІ> ( 2 ) 

тождественное после замены неизвестных х и х г , ..., х п их выра- 
жениями (1). Линейное преобразование неизвестных (1), обладающее 
этим свойством, т. е., как говорят, оставляющее сумму квадратов 
неизвестных инвариантной, называется ортогональным преобразова- 
нием неизвестных, а его матрица С} — ортогональной матрицей. 

Существует много других определений ортогонального преобра- 
зования и ортогональной матрицы, эквивалентных приведенным выше. 
Укажем некоторые из них, необходимые для дальнейшего. 

Мы знаем из § 26 закон, по которому преобразуется матрица 
квадратичной формы при выполнении линейного Преобразования неиз- 
вестных. Применяя его к нашему случаю и учитывая, что матрицей 
квадратичной формы, являющейся суммой квадратов всех неизвест- 
ных, служит единичная матрица Е, мы получим, что равенство (2) 
равносильно матричному равенству 

<3'ЕЕ>~Е, 

С>'С} = Е. (3) 

Отсюда 

<2' = <Г\ (4) 

а поэтому справедливо и равенство 

<2Ф=Е. (5) 

Таким образом, ввиду (4), ортогональную матрицу С} можно 
определить как такую матрицу, для которой транспонирован- 
ная матрица $ равна обратной матрице С? -1 . Каждое из ра- 
венств (3) и (5) также может быть принято в качестве определения 
ортогональной матрицы. 

Так как столбцы матрицы (?' являются строками матрицы С?, 
то из (5) вытекает следующее утверждение: квадратная матрица О 
тогда и только тогда будет ортогональной, если сумма квад- 
ратов всех элементов любой ее строки равна единице, а сумма 
произведений соответственных элементов любых двух ее раз- 
личных строк равна нулю. Из (3) следует аналогичное утвержде- 
ние для столбцов матрицы С 

Переходя в равенстве (3) к определителям, мы получим ввиду 
того, что |(2'| = ](2|, равенство 

!(2і 2 = і. 
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Отсюда следует, что определитель ортогональной матрицы ра- 
вен ±1. Таким образом, всякое ортогональное преобразование 
неизвестных является невырожденным. Само собой разумеется, 
что утверждать обратное нельзя; отметим также, что далеко не вся» 
кая матрица с определителем, равным ±1, будет ортогональной. 

Матрица , обратная к ортогональной , сама будет ортого- 
нальной: Действительно, переходя в (4) к транспонированным мат» 
рицам, мы получим: 

(О- 1 )' = «Э')' = <2= ((Г 1 )-». 


С другой стороны, произведение ортогональных матриц сам » 
ортогонально. Действительно, если матрицы <2 и ортогональные, 
то, используя (4), а также равенство (6) из § 26 и аналогичное 
равенство, справедливое для обратной матрицы, мы получим: 

(ф#)' = = ІГ 1 = (С?/?) -1 . 


В § 37 будет использовано следующее утверждение: 

Матрица перехода от ортонормированной базы евклидова 
пространства к любой другой его ортонормированной базе яв- 
ляется ортогональной. 

Пусть, в самом деле, в пространстве Е п заданы две ортонорми- 
рованные базы е 1} е 2 , . . ., е п и е' х , е' г , . . ., е' п с матрицей перехода 

е' — С}е. 

Так как база е ортонормированная, то скалярное произведение лю- 
бых двух векторов, в частности любых двух векторов из базы е , 
равно сумме произведений соответственных координат этих векторов 
в базе е. Так как, однако, и база е' ортонормированная, то ска- 
лярный квадрат каждого вектора из е' равен единице, а скалярное 
произведение любых двух разных, векторов из е' равно нулю. От- 
сюда для строк координат векторов базы е' в базе е, т. е. для 
строк матрицы 0, вытекают те утверждения, которые, как выведено 
выше из равенства (5), характерны для ортогональной матрицы. 

Ортогональные преобразования евклидова пространства. Сей- 
час уместно изучить один интересный специальный тип линейных 
преобразований евклидовых пространств, хотя преобразования этого 
типа и не будут у нас дальше использоваться. 

Линейное преобразование ф евклидова пространства Е п назы- 
вается ортогональным преобразованием этого евклидова простран- 
ства, если оно сохраняет скалярный квадрат всякого вектора, т. е. 
для любого вектора а 


(оф, вф) = («. а). 


( 6 ) 
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Отсюда выводится следующее более общее утверждение, которое, 
понятно, также может быть принято в качестве определения орто- 
гонального преобразования: 

Ортогональное преобразование ср евклидова пространства 
сохраняет скалярное произведение любых двух векторов а, Ь, 

(вф, д<р)=(а, Ь ). (7) 

Действительно, ввиду (6) 

((я-И)ф, (а + &)ф) = (а + &, а + Ь). 

Однако 

( (а + Ь) ф, (а Ь) ф) = (яф 4- Ь ф, аф -)- 6ф) — 

= И>, Яф) + (Яф, 6ф) + (6ф, йф) + (6ф, 6ф), 
{а-\- Ь, а Ь) — (а, а) -}- (а, Ь ) + (Ь, а) + ( Ь , Ь). 

Отсюда, используя (6) как для а , так и для Ь, и учитывая комму- 
тативность скалярного умножения, получаем" 

2(аф, 6ф) = 2(я, Ь), 
а поэтому имеет место и (7). 

При ортогональном преобразовании евклидова пространства 
образы всех векторов любой ортонормированной базы сами со- 
ставляют ортонормированную базу. Обратно, если линейное 
преобразование евклидова пространства переводит хотя бы одну 
ортонормированную базу снова в ортонормированную базу, то 
это преобразование ортогонально. 

В самом деле, пусть ф — ортогональное преобразование про- 
странства Е п , а е ѵ е 2 . ..., е п — произвольная ортонормированная 
база этого пространства, Ввиду (7) из равенств 

( е і, е,) = о при ІФІ 

вытекают равенства 

(«,-ф, в,-ф)=1, /=1, 2, ..., п, 

(е,ф, е уф) == 0 при іф], 

т, е. система векторов е х ф, е 2 ф, . . ., е п (р оказывается ортогональной 
и нормированной, а поэтому она будет ортонормированной базой 
пространства Е п . 

Обратно, пусть линейное преобразование ф пространства Е п 
переводит ортонормированную базу е г , е 2 , . .., е п снова в ортонор- 
мированную базу, т. е. система векторов ^ф, е 2 ф, . . ., е„ф является 
ортонормированной базой пространства Е п . Если 

а— 

1 
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— произвольный вектор пространства Е п , то 

а<р= (*іФ). 

( = і 


т. е. вектор сф имеет в базе еф те же координаты, что и вектор а 
в базе е. Эти обе базы являются, однако, ортонормированными, а 
поэтому скалярный квадрат любого вектора равен сумме квадратов 
ею координат в любой из этих баз. Таким образом, 

П 

(а, а) = (аф, шр) = 2 а/, 

і=і 


т. е. равенство (6) действительно выполняется. 

Ортогональное преобразование евклидова пространства в лю- 
бой ортонормированной базе задается ортогональной матрицей. 
Обратно, если линейное преобразование евклидова пространства 
хотя бы в одной ортонормированной базе задается ортогональ- 
ной матрицей, то это преобразование ортогонально. 

Действительно, если преобразование ф ортогональное, а база 
е г , е 2 , . . . , е п ортонормированная, то и система векторов е/р, е/р, . . . 
..., е п ф будет ортонормированной базой. Матрица Л преобразова- 
ния ф в базе е, 

еф =Ае, (8) 

будет, следовательно, матрицей перехода от ортонормированной 
базы е к ортонормированной базе еф, т. е., как доказано выше, 
будет ортогональной. 

Обратно, пусть линейное преобразование ф задается в ортонор- 
мированной базе е ѵ е 2 , е„ ортогональной матрицей А; имеет 

место, следовательно, равенство (8). Так. как база е ортонормиро- 
ванная, то скалярное произведение любых векторов, в частности 
любых векторов из системы е х (р, е 2 ф, ..., е„ф, равно сумме произ- 
ведений соответственных координат этих векторов в базе е. Поэтому, 
так как матрица А ортогональна, 

(е/р, <?,ф) = 1, 1=1, 2, ..., п, 

(е,ф, с/р) = 0 при іф], 

т. е. система вф сама оказывается ортонормированной базой про- 
странства Е п . Отсюда вытекает ортогональность преобразования ф. 

Как читатель знает из курса аналитической геометрии, среди 
всех аффинных преобразований плоскости, оставляющих на месте 
начало координат, вращения (соединенные, быть может, с зер- 
кальными отражениями) являются единственными, сохраняющими 
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скалярное произведение векторов. Таким образом, ортогональные 
преобразования л-мерного евклидова пространства можно рассматри- 
вать как «вращения» этого пространства. 

К числу ортогональных преобразований евклидова пространства 
принадлежит, очевидно, тождественное преобразование. С другой 
стороны, установленная нами связь между ортогональными преобра- 
зованиями и ортогональными матрицами, а также изложенная в § 31 
связь между операциями над линейными преобразованиями и над 
матрицами позволяют из известных свойств ортогональных матриц 
вывести следующие свойства ортогональных преобразований евкли- 
дова пространства, , легко проверяемые и непосредственно: 

Всякое ортогональное преобразование является невырожден- 
ным и его обратное преобразование также ортогонально. 

Произведение любых ортогональных преобразований ортого- 
нально. 


§ 36. Симметрические преобразования 

Линейное преобразование <р л-мерного евклидова пространства 
называется симметрическим (или самосопряженным), если для 
любых векторов а, Ь этого пространства имеет место равенство 

(аср, 6) = (а, дер), (1) 

т. е. символ симметрического преобразования можно при скалярном 
умножении переносить с одного множителя на другойі 

Примерами симметрических преобразований служат, очевидно, 
тождественное преобразование е и нулевое преобразование ю. Более 
общим примером является линейное преобразование, при котором 
всякий вектор умножается на фиксированное число а, 

аср — аа. 

Действительно, в этом случае 

(аср, Ь) = (аа, Ь) — а(а, Ь) — (а, а Ь) = (а, йср). 

Роль симметрических преобразований весьма велика и нам необ- 
ходимо изучить их достаточно детально. 

Симметрическое преобразование евклидова пространства в лю- 
бой ортонормированной базе задается симметрической матри- 
цей. Обратно, если линейное преобразование евклидова про- 
странства хотя бы в одной ортонормированной базе задается 
симметрической матрицей, то это преобразование симметри- 
ческое. 

Действительно, пусть симметрическое преобразование ср задается 
в ортонормированной базе е 1г е г , ..., е а матрицей А=( Учи- 
тывая, что в ортонормированной базе скалярное произведение двух 
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векторов равно сумме произведений соответственных координат этих 
векторов, мы получаем: 

(е,.ф, е у ) = (||а іЛ , 

( е і> е/р) = (е„ ==«//. 

т. е., ввиду (1), 

а и= а л 

для всех I и у. Матрица Л оказалась, таким образом, симметри- 
ческой. 

Обратно, пусть линейное преобразование <р задается в ортонор- 
мированной базе е ѵ е г< е п симметрической матрицей А = (а,- у), 

а і ,=и іі для всех і и /. (2) 

Если 

й =2 |РА, 

• — любые векторы пространства, то 

й ф = 2 Р/ (</р) = 2(2 Рлѵ) е /> 

л п / п \ 

2 V/ (е/Р) = 2 2 урф- 

Используя ортонормированность базы е, получаем 

(6ф, с)= 2 Р,«г/Ѵ/. 

/. г=і 7 ' 

(Ь, сф)= 2 Р,Ѵ/ а /,- 
*./=і ' 

Ввиду (2) правые части последних равенств совпадают, а поэтому 

(&р, с) = (#, Сф), 
что и требовалось доказать. 

Из полученного результата вытекает следующее свойство сим- 
метрических преобразований, легко проверяемое и непосредственно: 

Сумма симметрических преобразований, а также произведение 
симметрического преобразования на число являются симметри- 
ческими преобразованиями. 

Докажем теперь следующую важную теорему: 

Все характеристические корни симметрического преобразо- 
вания действительны. 
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Так как характеристические корни любого линейного преобразо- 
вания совпадают с характеристическими корнями матрицы этого 
преобразования в любой базе, а симметрическое преобразование 
задается в ортонормированных базах симметрическими матрицами, 
то достаточно доказать следующее утверждение: 

Все характеристические корни симметрической матрицы 
действительны. 

В самом деле, пусть Я 0 будет характеристический корень (быть 
может, комплексный) симметрической матрицы Л = (сс^), 

\А — Х 0 5| = 0. 

Тогда система линейных однородных уравнений с комплексными 
коэффициентами 

і — 1 , 2, . . . , п, 

/=і 


имеет равный нулю определитель, т. е. обладает ненулевым 
решением р 4 , р 2 , . ... Р„, вообще говоря, комплексным; таким 
образом, 

2а, 7 Р / = Я 0 р,-, /=1, 2 п. ^3) 

І=і 

Умножая обе части каждого /-го из равенств (3) на число р,-, соп- 
ряженное с числом р,-, и складывая отдельно левые и правые 
части всех получающихся равенств, мы приходим к равенству 

2 «//РД“ Х ° 2 РД* (4) 

I. 1=1 І = 1 


Коэффициент при Я 0 в (4) является отличным от нуля действи- 
тельным числом, будучи суммой неотрицательных действительных 
чисел, хотя бы одно из которых строго положительно. Действи- 
тельность числа Я 0 будет поэтому доказана, если мы докажем 
действительность левой части равенства (4), для чего достаточно 
показать, что это комплексное число совпадает со своим сопря- 
женным. Здесь впервые будет использована симметричность (дей- 
ствительной) матрицы А. 


2 а і/Р/Рі — 2 а «/РД — 2 а іуР/Рі~ 

і. і=і і. ]=і и і=і 

“ 2 «уДР <■*= 2 «.-АР/ 8 - 2 а , 7 РД- 

і. і=і і, і=і і. і=і 


Заметим, что предпоследнее равенство получено простой переме- 
ной обозначений для индексов суммирования: вместо і поставлено у, 
вместо ] поставлено і. Теорема, следовательно, доказана. 
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Линейное преобразование <р евклидова пространства Е п тогда 
и только тогда будет симметрическим, если в пространстве Е п 
существует ортонормированная база, составленная из собствен- 
ных векторов этого преобразования. 

В одну сторону это утверждение почти очевидно: если в Е п 
существует ортонормированная база е ѵ е 2 , . . . , е П , причем 

е,ф = * = 2 п, 

то в базе е преобразование ф задается диагональной матрицей 

(\ °) 


(О к) 

Диагональная матрица является, однако, симметрической, а поэтому 
преобразование ф задается в ортонормированной базе е симметри- 
ческой матрицей, т. е. будет симметрическим. 

Основное обратное утверждение теоремы мы будем доказывать 
индукцией по размерности п пространства Е п . В самом деле, при 
п — 1 всякое линейное преобразование ф пространства Е х непре- 
менно переводит любой вектор в вектор, ему пропорциональный. Отсюда 
следует, что всякий ненулевой вектор а будет собственным векто- 
ром для ф (как, впрочем, следует и то, что всякое линейное пре- 
образование пространства Е х будет симметрическим). Нормируя 
вектор а, мы получим искомую ортонормированную базу прост- 
ранства Е х . 

Пусть утверждение теоремы уже доказано для (п — 1)-мерного 
евклидова пространства и пусть в пространстве Е п задано сим- 
метрическое преобразование ф. Из доказанной выше теоремы вы- 
текает существование для ф действительного характеристического 
корня Я 0 . Это число будет, следовательно, собственным значением 
для преобразования ф. Если а — собственный вектор преобразова- 
ния ф, относящийся к этому собственному значению, то и всякий 
ненулевой вектор, пропорциональный вектору а, будет для ф соб- 
ственным вектором,, относящимся к тому же собственному значению 
Я 0 , так как 

(а а) ф = а (аф) = а (Я 0 а) = Я 0 (аа). 

В частности, нормируя вектор а , мы получим такой вектор е 1 , что 

е іФ ~ ^о е і> 

( е і> ві) = 1- 

Как доказано в § 34, ненулевой вектор е х можно включить в 
ортогональную базу 

• * Ч (3) 
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пространства Е п . Те векторы, первая координата которых в базе (5) 
равна нулю, т. е. векторы вида а 2 е 2 + ... +а п е^, составляют, 
очевидно, (я — 1)-мерное линейное подпространство пространства Е п , 
которое мы обозначим через I. Это будет даже ( п — 1 [-мерное 
евклидово пространство, так как скалярное произведение, будучи 
определенным для всех векторов из Е п , определено, в частности, 
для векторов из і, причем обладает всеми необходимыми свойствами. 

Подпространство Т состоит из всех тех векторов пространства 
Е п , которые ортогональны к вектору е і. Действительно, если 

а = а 1 е 1 +а 2 е1+ ... +а п е' п , 

то, ввиду ортогональности базы (5) и нормированное™ вектора е и 
(*і, а)=а 1 {е и <?і) + а 2 (е и е' г ) + ... +а' п (е и е' п ) = а и 

т. е. (е и а) = 0 тогда и только тогда, если аіг=0. 

Если вектор а принадлежит к подпространству Е, т. е. 
(й ь а) = 0, то и вектор а <р содержится в і. Действительно, ввиду 
симметричности преобразования ф, 

(е и яф) = (е'іф, о) ~ (Яо«і, а)=Х 0 К а) = Х 0 - 0=0, 

т. е. вектор йф ортогонален к «і и поэтому содержится в і. Это 
свойство подпространства Ь, называемое его инвариантностью отно- 
сительно преобразования ф, позволяет считать ф, рассматри- 
ваемое лишь в применении к векторам из I, линей- 
ным преобразованием этого (л — 1)-мерного евклидова пространства. 
Оно будет даже симметрическим преобразованием пространства Ь, 
так как равенство (1), выполняясь для любых векторов из Е п , будет 
выполняться, в частности, для векторов, лежащих в I*. 

В силу индуктивного предположения в пространстве і сущест- 
вует ортонормированная база, состоящая из собственных векторов 
преобразования ф; обозначим ее через е 2 , ..., е п . Все эти векторы 
ортогональны к вектору е и а поэтому е ІГ е 2 , .... е п будет иско- 
мой ортонормированной базой пространства Е п , состоящей из соб- 
ственных векторов преобразования ф. Теорема доказана. 

§ 37. Приведение квадратичной формы к главным осям. 

Пары форм 

Применим последнюю теорему предшествующего параграфа 
к доказательству следующей матричной теоремы: 

Для всякой симметрической матрицы А можно найти такую 
ортогональную матрицу которая приводит матрицу А к диа- 
гональному виду, т. е. матрица полученная трансфор- 

мированием матрицы А матрицей С Ъ будет диагональной. 
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В самом деле, пусть дана симметрическая матрица А порядка п. 
Если е и вг, . .., е п — некоторая ортонормированная база л-мерного 
евклидова пространства Е п , то матрица А задает в этой базе сим- 
метрическое преобразование ф. Как доказано, в Е п существует 
ортонормированная база /і, / 2 , ..., /„, составленная из собственных 
векторов преобразования ф; в этой базе ф задается диагональной 
матрицей В (см. § 33). Тогда, по § 31, 

5 = 0 -^, ( 1 ) 

где <2 — матрица перехода от базы / к базе е, 

е=<2/. (2) 

Эта матрица, как матрица перехода от одной ортонормированной 
базы к другой такой же базе, будет ортогональной — см. § 35. 
Теорема доказана. 

Так как для ортогональной матрицы (3 ее обратная матрица равна 
транспонированной, ф _1 =Р', то равенство (1) можно переписать 
в виде 

В=<3’А<Э. 


Из § 26 известно, однако, что именно так преобразуется симмет- 
рическая матрица А квадратичной формы, подвергнутой линейному 
преобразованию неизвестных с матрицей С}. Учитывая же, что ли- 
нейное преобразование неизвестных с ортогональной матрицей яв- 
ляется ортогональным преобразованием (см. § 35) и что диаго- 
нальную матрицу имеет квадратичная форма, приведенная к 
каноническому виду, мы на основании предшествующей теоремы 
получаем следующую теорему о приведении действи- 
тельной квадратичной формы к главным осям: 

Всякая действительная квадратичная форма /{х ѵ х 2 , ...,х п ) 
некоторым ортогональным преобразованием неизвестных может 
быть приведена к каноническому виду. 

Хотя может существовать много различных ортогональных пре- 
образований неизвестных, приводящих данную квадратичную форму 
к каноническому виду, однако сам этот канонический вид по су- 
ществу определяется однозначно: 

Каково бы ни было ортогональное преобразование, приводящее 
к каноническому виду квадратичную форму /(х г , лг 3 , ..., х п ) 
с матрицей А, коэффициентами этого канонического вида будут 
характеристические корни матрицы А, взятые с их кратно- 
стями. 

Пусть, в самом деле, форма / некоторым ортогональным пре- 
образованием приведена к каноническому виду 

/(*і. *2, .... *„)=ФО'і+]*яУ*+ ... +Ѵ-Уп. 
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Это ортогональное преобразование оставляет инвариантной сумму 
квадратов неизвестных, а поэтому, если Я — новое неизвестное, то 


/(*!, * 2 , 


х п)~ Я 2 ■** = 


1 = 1 


П 


п 


2 2 *’• 

/=і /=1 


Переходя к определителям этих квадратичных форм и учитывая, 
что после выполнения линейного преобразования определитель 
квадратичной формы умножается на квадрат определителя преоб- 
разования (см. § 28), а квадрат определителя ортогонального 
преобразования равен единице (см. § 35), мы приходим к равенству 



Рі— А, 

0 

• о 1 

А — Щ = 

0 

И» А, 

• О 


0 

0 

•• Йп-А. 


П 


П (ц« - я,), 

і=і 


из которого вытекает утверждение теоремы. 

Этому результату можно придать также матричную формулировку: 

Какова бы ни была ортогональная матрица, приводящая 
к диагональному виду симметрическую матрииу А, на главной 
диагонали полученной диагональной матрицы будут стоять ха- 
рактеристические корни матрицы А, взятые с их кратностями. 

Практическое разыскание ортогонального преобразования, при- 
водящего квадратичную форму к главным осям. В некоторых 
задачах необходимо знать не только тот канонический вид, к ко- 
торому приводится действительная квадратичная форма ортого- 
нальным преобразованием, но и само ортогональное преобразование, 
осуществляющее это приведение. Было бы затруднительно разыс- 
кивать это преобразование, используя доказательство теоремы 
о приведении к главным осям, и мы хотим указать иной путь. 
Именно, нужно лишь научиться находить ортогональную матрицу ( 
приводящую данную симметрическую матрицу А к диагональному 
виду, или, что то же самое, находить ее обратную матрицу С ? -1 . 
Ввиду (2) это будет матрица перехода от базы е к базе /, т. е. 
ее строки являются координатными строками (в базе е) ортонор- 
мированной системы из п собственных векторов симметрического 
преобразования <р, определяемого матрицей А в базе е. Остается 
найти такую систему собственных векторов. 

Пусть Х 0 — любой характеристический корень матрицы А и пусть 
его кратность равна к и . Из § 33 мы знаем, что совокупность коор- 
динатных строк всех собственных векторов преобразования ср, отно- 
сящихся к собственному значению Л. 0 , совпадает с совокупностью 
ненулевых решений системы линейных однородных уравнений 

(А—Х 0 Е)Х= 0; (3) 


симметричность матрицы А позволяет написать здесь А вместо А' 
Из доказанных выше теорем существования ортогональной матрицы, 
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приводящей симметрическую матрицу А к диагональному виду, и 
единственности этого диагонального вида вытекает, что для си- 
стемы (3) во всяком случае можно найти к 0 линейно независимых 
решений. Такую систему решений ищем методами, известными из 
§ 12, а затем ортогонализируем и нормируем полученную систему 
в соответствии с § 34. 

Беря в качестве Яо поочередно все различные характеристиче- 
ские корни симметрической матрицы А и учитывая, что сумма 
кратностей этих корней равна п , мы получим систему из п соб- 
ственных векторов преобразования ф, заданных их координатами 
в базе е. Для доказательства того, что это будет искомая орто- 
нормированная система собственных векторов, остается доказать 
следующую лемму: 

Собственные векторы симметрического преобразования (р, от- 
носящиеся к различным собственным значениям, между собой, 
ортогональны. 

Пусть, в самом деле, 

Інр=ХіЬ, сф = Я 2 с, 
причем Яі ф Я 2 . Так как 

(йр, с) = (Я іЬ, с) — Яі (Ь, с), 

(Ь, су) = (Ь, Я 2 с) — Я 2 (Ь, с), 

то из 

(6ф, с) = (Ь, Сф) 


следует 

или, ввиду Яі ф Я 2 , 


Я ,(й, с) — Я 2 (Ь, с) 
(Ь, с) = О, 


что и требовалось доказать. 


Пример. Привести к главным осям квадратичную форму 

/ ( ху , т 2 , х . , х,) 2хрс^ 1 —Х\Х^ 2х^х^ 2х%Хд -{- 2х%Хф ф2х$х^. 

Матрица А этой формы имеет вид 



Найдем ее характеристический многочлен: 

—Я 1 1—1 

\А-\Е\= { | = (Я-1)ЧЯ + 3). 

— 1 1 1 —Я 
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Таким образом, матрица А имеет трехкратный характеристический корень 1 
и простой характеристический корень — 3 . Мы уже можем, следовательно, 
написать тот канонический вид, к которому форма / приводится ортогональ- 
ным преобразованием: 

Ь=у\+у\+у\—^у\- 

Найдем ортогональное преобразование, осуществляющее это приведение. 
Система линейных однородных уравнений ( 3 ) при Х 0 =1 принимает вид 

Хі Хд “Ь Х 3 X 4 е= 0, 

*1— Х 2 — * 3 -{-х 4 «=»0, 
х і~ х і~ * 3 +х 4 = 0, 
к — х 1 + х і + х 3 — х 4 = 0. 


Ранг этой системы равен 1, и поэтому для нее можно найти три линейно 
независимых решения. Ими будут, например, векторы 

&і=(1, 1, 0, 0), 

*а = (1, 0, 1, 0), 

&з=(- 1 , 0 . 0 , I). 

Ортогонализируя эту систему векторов, мы получим систему векторов 

Сі=А = (1, I, 0, 0), 

с а -~с 1 + 6 4 =(І,-І., 1, о), 

* / і і і Л 

Сз ==1 2 ^ * ь, 1 2 ,0 ,0,11. 

С другой стороны, система линейных однородных уравнений ( 3 ) прини- 
мает при Х 0 = — 3 вид 

{ 3*!+ х 3 + х 3 — х 4 = 0, 
х і + Зх г — х 3 + х 4 = 0, 

Хі— х г + Зх 3 + лг 4 = 0, 

— х 4 + х 2 + х 3 -)-Зх 4 = 0. 


Ранг этой системы равен 3 , Ее ненулевым решением служит вектор 

с 4 =(1, -1, -1, 1). 

Система векторов с 4 , с 2 , с 3 , с 4 ортогональная. Нормируя ее, мы придем 
к ортонормированной системе векторов 



0, 0^, 


1 і 

Ѵ~ 2 ' Ѵ" 2 ’ 

1 1 _ 

О’ 

і_ і і у"з \ 

2 ^ 3 ’ 2 V 3 ’ 2 V 3 ’ 2 ) 




§ 37] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К ГЛАВНЫМ ОСЯМ 


231 


Таким образом, форма I приводится к главным осям ортогональным преоб- 
разованием 


Уі ~Ѵ1 Хі+ 1П х *’ 

Ѵг= У% Хі ~\гЪ Хі+ 



і ,і ,і , V з 

2Я" 1+ 2^*‘ + 2^ І,+ 2 * 4 ’ 
1 1 1,1 
У і ~~2 Хі — 5 " ** — 2 Хз +~ 2 Х *' 


Следует отметить, что выбор системы линейно независимых собственных 
векторов, относящихся к кратному собственному значению, является весьма 
неоднозначным, а поэтому существует много различных ортогональных пре- 
образований, приводящих форму |Р к каноническому виду, Мы нашли лишь 
одно из них. 

Пары форм. Пусть дана пара действительных квад- 
ратичных форм от п неизвестных, /(хі, х 2 , х п ) и 

8(Хі, х 2 , х п ). Существует ли такое невырожденное линейное 

преобразование неизвестных Хі, х 2 х п , которое одновременно 

приводило бы обе эти формы к каноническому виду? 

В общем случае ответ будет отрицательным. Рассмотрим, на- 
пример, пару форм 

/(хі, х г ) = х\, е(хи Х 2 ) = ХіХ г . 

Пусть существует невырожденное линейное преобразование 

Хі ~ Сц)>і С і2 )>2, 1 
х 2 = СгіУі - 1 ~ С22У2, I 

приводящее обе эти формы к каноническому виду. Для того чтобы 
форма / могла быть приведена преобразованием (4) к канониче- 
скому виду, один из коэффициентов Сц, с должен быть равен 
нулю, иначе вошел бы член 2 СцС і2 уіу 2 . Меняя, если нужно, нуме- 
рацию неизвестных у,, у 2 , можно положить, что Сі 2=0 и по- 
этому Сц ф 0. Мы получим теперь, однако, что 

§{х і} Х 2 ) — Сц Уі {с 21 у і фС22У2) = С 11 С 2і у\+С ІІ С2 2 УіУ2- 
Так как форма § также должна была перейти в канонический вид, 
то с п с 2 2 = 0 , т. е. с 2 2 = 0, что вместе с с, 2 = 0 противоречит невы- 
рожденности линейного преобразования (4). 

Ситуация будет иной, если мы положим, что хотя бы одна из 
наших форм, например §{х ѵ х 2 , х п ), является положи- 

тельно определенной 1 ). Именно, справедлива теорема: 


4 ) Это условие не является, конечно, необходимым; так, формы х\ + 
+ х 2 — Хд и х\ — Хд — х| обе уже имеют канонический вид, хотя среди них 
нет положительно определенных. 
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Если / и § — пара действительных квадратичных форм от п 
неизвестных, причем вторая из них положительно определенная , 
то существует невырожденное линейное преобразование, одно- 
временно приводящее форму § к нормальному виду, а форму / 
к каноническому виду. 

Для доказательства выполним сначала невырожденное линейное 
преобразование неизвестных х ѵ х 2 , х п , 

Х= ТУ, 

приводящее положительно определенную форму $ к нормальному 
Е ИДу, 

ё{х ѵ х 2 , . .., х п ) +УІ + ... +у' п . 

Форма / перейдет при этом в некоторую форму ср от новых неиз- 
вестных, 

/(*,. х%, •••. *») = Ф0\, Уг, .... Уп). 

Совершим теперь ортогональное преобразование неизвестных 

Уѵ У* •••. У» 

Ѵ=<&, 

приводящее форму ф к главным осям, 

ф(Уі> Уь • ••. У „) = ^і г і + ^г г % 4* -\~^п г п- 

Это преобразование (см. определение в § 35) переводит сумму 
квадратов неизвестных у ѵ у 2 , ..., у п в сумму квадратов неиз- 
вестных г ѵ г 2 , •••! г п - В результате мы получаем 

/( х і, х 2 , х п ) = + . . . + ^„Дп, 

ё(х ѵ х 2, .... х „) = Х 1 +^2 +• • • • + ^л> 
т. е. линейное преобразование 

Х={Т0)2 


является искомым. 



ГЛАВА ДЕВЯТАЯ 

ВЫЧИСЛЕНИЕ КОРНЕЙ МНОГОЧЛЕНОВ 


§ 38*. Уравнения второй, третьей и четвертой степени 


Основная теорема, доказанная в § 23, устанавливает для любого 
многочлена я-й степени с числовыми коэффициентами существова- 
ние я комплексных корней. Ее доказательства (как приведенное 
выше, так и любые другие из ныне известных) не дают, однако, 
никаких методов для практического разыскания этих корней, яв- 
ляясь чистыми «доказательствами существования». Поиски таких 
методов начались, естественно, с попыток вывода формул, анало- 
гичных формуле для решения квадратного уравнения, известной 
читателю для случая действительных коэффициентов из школьного 
курса алгебры. Мы покажем сейчас, что эта формула остается 
справедливой и для квадратных уравнений с комплексными ко- 
эффициентами и что аналогичные формулы, хотя и много более 
громоздкие, могут быть выведены для уравнений третьей и 
четвертой степени. 

Квадратные уравнения. Пусть дано квадратное уравнение 

х 2 +рх-\-д = О 

с любыми комплексными коэффициентами; старший коэффициент без 
ограничения общности можно считать равным единице. Это уравне- 
ние можно переписать в виде 




=0. 


п 2 

Как мы знаем, нз комплексного числа ^ — д можно извлечь квад- 
ратный корень, не выходя за пределы системы комплексных чисел. 
Два значения этого корня, отличающихся друг от друга лишь зна- 


ком, мы запишем в виде 


± у ~ — д. Поэтому 

*+#-±УІ 


Е1 

4 
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т. е. корни заданного уравнения можно находить по обычной фор- 
муле 



Пример. Решить уравнение 

х 2 — Зх + (3—0=0. 

Применяя выведенную формулу, получаем: 

'-т± /т-е-о “І± -^=5+1»: 

При помощи методов § 19 мы находим: 

/—3 + 4»=*= ± (1+20, 

а поэтому 

х 1 = 2 + /, х 2 =1— і. 

Кубичные уравнения. В отличие от случая квадратных урав- 
нений, до сих пор у нас не было метода для решения кубичных 
уравнений даже в случае действительных коэффициентов. Сейчас 
мы выведем для кубичных уравнений формулу, аналогичную фор- 
муле для квадратных уравнений, причем сразу допустим, что ко- 
эффициенты являются любыми комплексными числами. 

Пусть дано кубичное уравнение 

у 3 ау 2 Ьу с — 0 (1) 

с любыми комплексными коэффициентами. Заменяя в уравнении (і) 
неизвестное у новым неизвестным х, связанным с у равенством 

( 2 ) 

мы получим уравнение относительно неизвестного х, не содержа- 
щее, как легко проверить, квадрата этого неизвестного, т. е. 
уравнение вида 

х 3 -}- рх + д = 0. (3) 

Если будут найдены корни уравнения (3), то, ввиду (2), мы полу- 
чим и корни заданного уравнения (1). Нам остается, следовательно, 
научиться решать «неполное» кубичное уравнение (3) с любыми 
комплексными коэффициентами. 

Уравнение (3) обладает по основной теореме тремя комплекс- 
ными корнями. Пусть Хо будет любой из этих корней. Введем вспо- 
могательное неизвестное и и рассмотрим многочлен 

/(ц) = ц 2 — л- 0 и — у . 
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Его коэффициенты — комплексные числа, и поэтому он обладает двумя 
комплексными корнями а и Р, причем, по формулам Вьета, 

«+Р = *о. (4) 

сф = -|. (5) 

Подставляя в (3) выражение (4) корня х 0 , мы получим: 

(а + Р) 3 + р(а + Р)+? = 0 

а3 + Р 3 + (Зсф+/>) (а + Р) + 0 — 0. 

Однако из (5) следует Зсф +/> = (), и поэтому мы получаем: 

а 3 + Р 3 = — Я- (6) 

С другой стороны, из (5) вытекает 

(7) 

Равенства (6) и (7) показывают, что числа а 3 и р 3 служат кор- 
нями квадратного уравнения 

г 2 +дг — |^=0 (8) 


с комплексными коэффициентами. 
Решая уравнение (8), мы получим: 



Мы приходим к следующей формуле Кардано , выражающей корни 
уравнения (3) через его коэффициенты при помощи квадратных 
и кубичных радикалов: 

= = ]/ Л — І+ V \ ~+2Г +]/ Л ~Т — V "4 Г + ’ІТ‘ 

Так как кубичный радикал имеет в поле комплексных чисел три 
значения, то формулы (9) дают три значения для а и три для р. 
Нельзя, однако, применяя формулу Кардано, комбинировать любое 
значение радикала а с любым значением радикала Р: для данного 
значения а следует брать лишь то из трех значений р, которое 
удовлетворяет условию (5). 

') Безразлично, какой из корней уравнения (8) принять за а 3 и какой — 
за р 3 , так как а и р в равенстве (6) и (7), а также в выражение (4) для х а 
входят симметричным образом. 
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Пусть сс х будет любое из трех значений радикала а. Тогда два 
других можно получить, как доказано в § 19, умножением а х на 
кубичные корни е и е 2 из единицы: 

а 2 =а 1 Ё, а 3 = а 1 е 2 . 

Обозначим через то из трех значений радикала |3, которое соот- 
ветствует значению а х радикала а на основании (5), т. е. С4 1 р 1 = ^ . 

Два других значения (3 будут 

Р 2 = Рі е - Рз = Рі® 2 - 

Так как, ввиду е 3 =1, 

а 2 Рз = а і е * Рі ® 2 = а іРі е3 = а іРі = з" > 

то значению а 2 радикала а соответствует значение р з радикала Р; 
аналогично значению а 3 соответствует значение Р 2 . Таким образом, 
все три корня уравнения (3) могут быть записаны следующим образом: 

* 2 = а 2 + Рз = а іе + Ріе 2 , | (10) 

•^з = а з + Р 2 — “і ® 2 + Рі е - ) 

Кубичные уравнения с действительными коэффициентами. По- 
смотрим, что можно сказать о корнях неполного кубичного уравнения 

х 3 + рх + Я = 0, (11) 

если его коэффициенты действительны. Оказывается, что в этом 

Ц г і Р 3 

случае основную роль играет знак выражения стоящего 

в формуле Кардано под знаком квадратного корня. Заметим, что 
знак этого выражения противоположен знаку выражения 

1) = — 4р 3 — 27д 2 = — 108 + , 

называемого дискриминантом уравнения (11) (ср. ниже, § 54); 
в дальнейших формулировках будет использоваться знак дискрими- 
нанта. 

1) Пусть О<;0. В этом случае в формуле Кардано под знаком 
каждого из квадратных радикалов стоит положительное число, 
а поэтому под знаком каждого из кубичных радикалов оказываются 
действительные числа. Однако кубичный корень из действитель- 
ного числа имеет одно действительное и два сопряженных комплекс- 
ных значения. Пусть а х будет действительное значение радикала а; 
тогда значение радикала (3, соответствующее а х на основании 
формулы (5), также будет действительным ввиду действительности 
числа р. Таким образом, корень = уравнения (11) оказы- 
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вается действительным. Два других корня мы найдем, заменяя в фор- 
мулах (10) настоящего параграфа корни из единицы е = ё х и е 2 = е а 
их выражениями (7) из § 19: 



эти два корня оказываются ввиду действительности чисел сс х и Р х 
сопряженными комплексными числами, причем коэффициент при мни- 
мой части отличен от нуля, так как а 1 =?^р 1 , — эти числа являются 
значениями различных кубичных радикалов. 

Таким образом, если /)< 0, то уравнение (11) имеет один 
действительный и два сопряженных комплексных корня. 

2) Пусть ,0—0. В этом случае 

Пусть а х будет действительное значение радикала а; тогда р х также 
будет, ввиду (5), действительным числом, причем а х = р х . Заменяя 
в формулах (10) р х через а х и используя очевидное равенство 
6 ф- Ё 2 = — 1, мы получим: 

Л' 1 = 2а 1 , х г = а х (еф-Ё 2 ) = — а х , •*г 3 =ос 1 (е 2 + е) = — а х . 

Таким образом, если 0 = 0, то все корни уравнения (11) дей- 
ствительны, причем два из них равны между собой. 

3) Пусть, наконец, О>0. В этом случае в формуле Кардано под 
знаком квадратного корня стоит отрицательное действительное число, 
а поэтому под знаками кубичных радикалов стоят сопряженные 
комплексные числа. Таким образом, все значения радикалов аир 
будут теперь комплексными числами. Среди корней уравнения (11) 
должен, однако, содержаться хотя бы одни действительный. Пусть 
Это будет корень 

Лг і = а о + (V 

Так как действительны и сумма чисел а 0 и Р 0 , и их произведение, 
равное — у, то числа а 0 и р 0 сопряжены между собой как корни 
квадратного уравнения с действительными коэффициентами. Но тогда 
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сопряжены между собой и числа о^е и (5 0 е 2 , а также числа а 0 е 2 и 
р 0 е, откуда следует, что корни уравнения (11) 

л 2 = а 0 е + р 0 е 2 , л- 3 = а 0 е 2 -Ьр 0 8 

также будут действительными числами. 

Мы получили, что все три корня уравнения (11) действительны, 
причем легко показать, что среди них нет равных. В самом деле, 
в противном случае выбор корня х 1 можно было бы осуществить 
так, чтобы имело место равенство х 2 =х 3 , откуда 

М 8 — е2 ) = Ро (е — е 2 ), 

т. е. а 0 = р 0 , что явно невозможно. 

Таким образом, если й>0, то уравнение (11) имеет три 
различных действительных корня. 

Рассмотренный сейчас последний случай показывает, что практи- 
ческое значение формулы Кардано весьма невелико. В самом деле, 
Хотя при йу> 0 все корни уравнения (11) с Действительными коэф- 
фициентами являются действительными числами, однако разыскание 
их по формуле Кардано требует извлечения кубичных корней из 
комплексных чисел, что мы умеем делать лишь переходом к триго- 
нометрической форме этих чисел. Поэтому запись корней с по- 
мощью радикалов теряет практическое значение. При помощи 
методов, выходящих за рамки нашей книги, можно было бы дока- 
зать, что в рассматриваемом случае корни уравнения (11) вообще 
никаким способом не могут быть выражены через коэффициенты 
при помощи радикалов с действительными подкоренными выраже- 
ниями. Этот случай решения уравнения (11) называется неприводи- 
мым (не смешивать с неприводимостью многочленов!). 


Примеры. 1. Решить уравнение 

у 3 + Зр 2 — Зу — 14 = 0. 

Подстановка (/ = *-■- 1 приводит это уравнение к виду 

х 3 — 6х — 9 = 0, 

Здесь р = — 6, у — — 9, поэтому 

г = 1? > о 
4 ^ 27 4 > ’ 


(12) 


т. е. уравнение (12) имеет один действительный и два сопряженных ком- 
плексных корня. По (9) а= 8 ’ Р = 1 ’ 

Поэтому а х = 2, р 1 =1, т. е, Хх = 3. Два других корня найдем по форму- 

3 , . уНз 3 . уз 

лам (10): х 2 = — — + х 3 = — і ~ . 

Отсюда следует, что корнями заданного уравнения служат числа 

о 5 , . Ѵъ 5 . Ѵ 'і 

У 2 — 2 2 1 — ' 2 2~ и 
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2. Решить уравнение 

х 3 — 12* +16=0. 

Здесь р= — 12, 9 = 16, поэтому 

-^ + -^- = 0 
4 + 27 

Отсюда следует: а— у/— 8, т. е. а г = — 2. Поэтому 

*! = — 4, *2 = *з = 2. 

8. Решить уравнение 

х 3 — 1 9* -р 30 = 0. 

Здесь р = — 19, 9 = 30, поэтому 

4 + 27 27 


Таким образом, если оставаться в области действительных чисел, формула 
Кардано к этому уравнению неприменима, хотя его корнями являются дей- 
ствительные числа 2, 3 и — 5. 


Уравнения четвертой степени. Решение уравнения четвертой 
степени 

у^-\- ау 2 -\-Ьу 2 -\- су й— 0 (13) 

с произвольными комплексными коэффициентами сводится к реше- 
нию некоторого вспомогательного кубичного уравнения. Достигается 
ѳто следующим методом, принадлежащим Феррари. 

Предварительно уравнение (13) подстановкой у = х — ~ приво- 
дится к виду 

х* + рх 2 + дх + г = 0. (14) 


Затем левая часть этого уравнения следующим образом тождественно 
преобразуется при помощи вспомогательного параметра а: 


х* + рх 2 + дх+г=^х 2 -\-^- + а,у + дх + г— ~—а 2 — 


или 


х *+т+ а У~ 


2ах 2 — дх + ра. — г + 


2ах 2 


= 0 . 


— рас 
(15) 


Подберем теперь а так, чтобы многочлен, стоящий в квадратных 
скобках, стал полным квадратом. Для этого он должен иметь один 
двукратный корень, т. е. должно иметь место равенство 

д 2 -4-2а^а 2 + ра—г + ~~^ = 0. (16) 


Равенство (16) является кубичным уравнением относительно неизвест- 
ного а с комплексными коэффициентами. Эго уравнение имеет, как 
мы знаем, три комплексных корня. Пусть а д будет один из них; он 
выражается ввиду формулы Кардано при помощи радикалов через 
коэффициенты уравнения (16), г. е. через коэффициенты уравнения (14). 
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При этом выборе значения для а многочлен, стоящий в квадрат- 

я 

4а„ 


дых скобках в (15), имеет двукратный корень и поэтому урав 


нение (15) принимает вид 

^ + | + а °) 2 - 2 а 0 (*-^) 2 = о , 


т. е. оно распадается на два квадратных уравнения; 



Так как от уравнения (14) к уравнениям (17) мы пришли при 
помощи тождественных преобразований, то корни уравнений (17) 
будут служить корнями и для уравнения (14}. Легко видеть вместе 
с тем, что корни уравнения (14) выражаются через коэффициенты 
при помощи радикалов. Мы не будем выписывать соответствующих 
формул ввиду их громоздкости и практической бесполезности, не 
станем также исследовать отдельно случай, когда уравнение (14) 
имеет действительные коэффициенты. 

Замечания об уравнениях высших степеней. В то время как 
методами решения квадратных уравнений владели еще древние греки, 
открытие изложенных выше методов решения уравнений третьей 
и четвертой степени относится к XVI веку. После этого почти три 
столетия продолжались безуспешные попытки сделать следующий 
шаг, т. е. найти формулы, выражающие при помощи радикалов корни 
любого уравнения пятой степени (т. е. уравнения пятой степени 
с буквенными коэффициентами) через его коэффициенты. Эти 
попытки прекратились лишь после того, как Абель в двадцатых 
годах прошлого века доказал, что такие формулы для уравнений л-й 
степени при любом п ^ 5 заведомо не могут быть найдены. 

Этот результат Абеля не исключал, однако, возможности того, 
что корни всякого конкретного многочлена с числовыми коэффи- 
циентами все же каким-либо способом выражаются через коэффи- 
циенты при помощи некоторой комбинации радикалов, т. е., как 
принято говорить, что всякое уравнение разрешимо в радикалах. 
Полностью вопрос об условиях, при которых данное уравнение раз- 
решимо в радикалах, был исследован Галуа в тридцатых годах про- 
шлого века. Оказалось, что для всякого я, начиная с я = 5, можно 
указать неразрешимые в радикалах уравнения л-й степени даже 
с целочисленными коэффициентами. Таким будет, например, уравнение 

х ъ — Ах — 2 = 0. 


Исследования Галуа оказали, решающее влияние на дальнейшее 
развитие алгебры. Их изложение не входит, однако, в наши задачи. 
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§ 39. Границы корней 

Мы знаем, что не существует метода для разыскания точных значе- 
ний корней многочленов с числовыми коэффициентами. Тем не менее, 
самые различные проблемы механики, физики и всевозможных отрас- 
лей техники сводятся к вопросу о корнях многочленов, притом иногда 
достаточно высоких степеней. Это обстоятельство явилось поводом 
для весьма многочисленных исследований, имевших целью научиться 
делать те или иные высказывания о корнях многочлена с числовыми 
коэффициентами, не зная этих корней. Изучался, например, вопрос 
о расположении корней на комплексной плоскости (условия, при 
которых все корни лежат внутри единичного круга, т. е. по модулю 
меньше единицы, или условия для того, чтобы все корни лежали в левой 
полуплоскости, т. е. имели бы отрицательные действительные части, 
и т. д.). Для многочленов с действительными коэффициентами разра- 
батывались методы определения числа их действительных корней, 
разыскивались границы, между которыми эти корни могут находиться, 
и т. д. Наконец, много исследований было посвящено методам прибли- 
женного вычисления корней: в технических приложениях обычно 
достаточно знать лишь приближенные значения корней с некоторой 
заранее данной точностью и если бы, например, корни многочлена 
даже записывались в радикалах, эти радикалы все равно были бы 
заменены их приближенными значениями. 

Все эти исследования составляли в свое время основное содержа- 
ние высшей алгебры. Мы включаем в наш курс лишь весьма небольшую 
часть относящихся сюда результатов, причем, учитывая первоочеред- 
ные потребности приложений, ограничиваемся случаем многочленов 
с действительными коэффициентами и их действительных корней, 
лишь иногда выходя за эти рамки. При этом мы будем системати- 
чески рассматривать многочлен / (х) с действительными коэффици- 
ентами как (непрерывную) действительную функцию действитель- 
ного переменного х и всюду, где это будет полезно, будем применять 
результаты и методы математического анализа. 

Исследование действительных корней многочлена /(х) с действи- 
тельными коэффициентами полезно начинать с рассмотрения графика 
этого многочлена: действительными корнями многочлена будут, 
очевидно, абсциссы точек пересечения его графика с осью х и 
только они. 

Рассмотрим, например, многочлен пятой степени 
Н (х) = х ь + 2 л : 4 — 5 л : 3 + 8 л : 2 — 7 л : — 3 . 

На основании результатов § 24 о корнях этого многочлена можно 
утверждать следующее: так как его степень нечетна, то Н (х) обладает 
хотя бы одним действительным корнем; если же число действитель- 
ных корней больше единицы, то оно равно трем или пяти, так как 
комплексные корни попарно сопряжены. 
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Рассмотрение графика многочлена к ( х ) позволяет сказать больше 
о его корнях. Построим этот график (рис. 9) х ), беря лишь целые 
значения х и вычисляя соответствующие значения к ( х ) хотя бы 

методом Горнера: 



X 

к(х) 

—4 

— '39 

— 3 

144 

—2 

83 

— 1 

18 

0 

— 3 

1 

—4 

2 

39 


Мы видим, что многочлен к (*) во 
всяком случае имеет три действи- 
тельных корня — положительный 
корень а х и два отрицательных 
корня а 2 и а 3 , причем 

1 <а 1 <2, — 1<а г <0, 

— 4<а 3 <— 3. 

Информация о (действительных) 
корнях многочлена, получающаяся 
от рассмотрения графика, практи- 
чески обычно оказывается весьма 
удовлетворительной. Однако каж- 
дый раз остаются сомнения, дейст- 
вительно ли нами найдены все корни. Так, в рассмотренном при- 
мере мы не показали, что правее точки л;=»2 и левее х — — 4 
уже нет корней многочлена. Больше того, так как мы брали лишь 
целочисленные значения х, то можно допустить, что построенный 
нами график не вполне точно отражает истинное поведение функ- 
ции к (х), не учитывает, быть может, ее более мелких колебаний 
и поэтому упускает некоторые корни. 

Правда, можно было бы при построении графика брать не только 
целочисленные значения х, а значения с точностью до 0,1 или 0,01. 
Этим, однако, сразу чрезвычайно усложнилось бы вычисление значе- 
ний к(х), в то время как отмеченные выше сомнения отнюдь не были 
бы ликвидированы. С другой стороны, можно было бы методами 


1 ) На рисунке масштаб по оси у взят в десять раз меньшим, чем по оси*. 
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математического анализа исследовать функцию к{х) на максимум и 
минимум и таким путем сравнить наш график с истинным поведением 
функции; это приводит, однако, к вопросу о корнях производной 
к' (х), т. е. к такой же задаче г как и та, которой мы занимаемся. 

Отсюда вытекает потребность в более совершенных методах для 
разыскания границ, между которыми расположены действительные 
корни многочлена с действительными коэффициентами, и для опре- 
деления числа этих корней. Сейчас мы будем заниматься вопросом 
о границах действительных корней, отнеся вопрос об их 
числе к следующим параграфам. 

Доказательство леммы о модуле старшего члена (см. § 23) уже 
дает некоторую границу для модулей корней многочлена. Действи- 
тельно, полагая в неравенстве (3) § 23 к~\, мы получаем, что при 

( 1 ) 


где а 0 — старший коэффициент, а А — максимум модулей остальных 
коэффициентов, модуль старшего члена многочлена больше модуля 
суммы всех остальных членов, а поэтому никакое значение х, удов- 
летворяющее неравенству (1), не может служить корнем этого 
многочлена. 

Таким образом, для многочлена /(х) с любыми числовыми коэф- 

А 

фициентами число 1 +| — | служит верхней границей для моду- 


лей всех его корней, действительных и комплексных. Так, для 
рассмотренного выше многочлена Н(х) этой границей, ввиду а 0 = 1, 
Л = 8, служит число 9. 

Эта граница обычно оказывается, однако, слишком высокой, осо- 
бенно если мы интересуемся лишь границами действительных корней. 
Сейчас будут изложены другие методы, более точные. При этом сле- 
дует помнить, что если указываются границы, между которыми должны 
содержаться действительные корни многочлена, то этим вовсе 
не утверждается, что такие корни на самом деле 
существуют. 

Покажем сначала, что достаточно уметь находить лишь верх- 
нюю границу положительных корней любого многочлена. В самом 
деле, пусть дан многочлен /(х) степени п и пусть ІѴ 0 будет верх- 
ней границей его положительных корней. Рассмотрим многочлены 


Фі(*)=* п /(^-) , 
<Ь (*)=/(— X), 

Фз (*)=*"/( — ~) 


и найдем верхние границы их положительных корней; пусть это 
будут соответственно числа N 1 , ІѴ 2 , N3. Тогда число ~ будет 
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нижней границей положительных корней многочлена /( х ): если а 
есть положительный корень /(я), то -4 будет положительным кор- 
нем для (лг), и из следует а^>~. Аналогично числа 

1 ! 

— /Ѵ 2 и — -гг- служат соответственно нижнеи и верхней границами 

/V з 

отрицательных корней многочлена /(х). Таким образом, все по- 
ложительные корни многочлена /(х) удовлетворяют неравенствам 

•дт- < х < А/ 0 , все отрицательные корни — неравенствам 

~ М 2<Х<—^~ . 


Для определения верхней границы положительных корней можно 
применить следующий метод. Пусть дан многочлен 

/{х) = а 0 х п + а 1 х п ~ 1 + . . . + ч а„ 

с действительными коэффициентами, причем а 0 >-0. Пусть, далее, 
а к , к^ь 1, будет первым из отрицательных коэффициентов; если бы 
таких коэффициентов не было, то многочлен /(х) вообще не мог бы 
иметь положительных корней. Наконец, пусть В будет наибольшая 
из абсолютных величин отрицательных коэффициентов. Тогда число 



служит верхней границей положительных корней многочлена /{х). 

В самом деле, полагая *;> 1 и заменяя каждый из коэффициен- 
тов а ѵ а 2< . .., а к _ 1 числом нуль, а каждый из коэффициентов а к , 
а к+ 1 , ..., а п — числом — В, мы можем лишь уменьшить значение 
многочлена, т. е. 


/(X) 

а 0 х п — В(х п ~ 

* + *"-*- 

г п~Ь + і 

+ •■■+*+! )~а 0 х В л ._ 1 

і 

— г 

т. е., 

ввиду ху> 1, 





/( х)>а 0 х п - 

Вх п-к+1 




х—\ 

= [а 0 х* -1 (х — 1) — В]. 

(2) 

Если 







1 

4 % 

(3) 

то, так как 





а 0 х к 1 (х— 1) — 55* а 0 (х— 1)* — В, 


выражение в квадратных скобках в формуле (2) окажется положи- 
тельным, т. е., ввиду (2), значение /(х) будет строго положитель- 
ным. Таким образом, значения х, удовлетворяющие неравенству (3), 
не могут служить корнями для /( х ), что и требовалось доказать. 
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Для рассмотренного вЬіше многочлена Н(х) этот метод дает, 
ввиду к — 2 и В= 7, в качестве верхней границы положительных 
корней число 1 7, что можно заменить ближайшим большим 

целым числом 4. 

Из многочисленных других методов разыскания верхней границы 
положительных корней мы изложим еще лишь метод Ньютона. 
Этот метод более громоздок, чем изложенный выше, но зато дает 
обычно очень хороший результат. 

Пусть дан многочлен /( х ) с действительными коэффициентами 
и положительным старшим коэффициентом а 0 . Если при х=с много- 
член /( х ) и все его последовательные производные /' (х), / " (х ),. . . 

. . . , / (П) (х) принимают положительные значения, то число с слу- 
жит верхней границей положительных корней. 

В самом деле, по формуле Тэйлора (см. § 23) 

/ (х) =/(с) + (х-с)Г(с) + (х-с)>-Цр+...+(х- с) п М . 

Мы видим, что если х^ с, то справа будет стоять строго положи- 
тельное число, т. е. такие значения х не могут служить корнями 
для /(х). 

При разыскании для данного многочлена /(х) соответствующего 
числа с полезно поступать следующим образом. Производная / (П) (х)= 
— п\а 0 является положительным числом, поэтому многочлен /' п ~ ѵ (х) 
является возрастающей функцией х. Существует, следовательно, та- 
кое число с х , что при х^с х производная / <п ~ 1) (х ) положительна. 
Отсюда следует, что при х^с х производная / ( ” _2) (х) будет возра- 
стающей функцией л:, поэтому существует такое число с 2 , с 2 ^ с у , 
что при х'^-с г производная / ш ~ 2) (х) также будет положительной. 
Продолжая далее, мы дойдем, наконец, до искомого числа с. 

Применим метод Ньютона к рассматривавшемуся выше многочлену Н (х). 
Мы имеем: 

Н(х) = х ъ + 2*4 — 5* 3 + 8х 2 — 7х — 3, 

Н' (х) = 5х 4 + 8х 3 — 1 5х 2 +16х—7, 

Н" (х) = 20х 3 + 2іх 2 — 30т + 16, 

Н"’(х) = 60х 2 + 48х— 30, 
й ІѴ (лО = 120* + 48, 

А ѵ (х)= 120. 


Легко проверить (хотя бы методом Горнера), что все эти многочлены 
положительны при х = 2. Таким образом, число 2 служит верхней границей 
положительных корней многочлена к (х) — результат, много более точный, 
чем полученные выше другими методами. 
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Для разыскания нижней границы отрицательных корней многочлена к (л) 
рассмотрим многочлен ф 2 (х) = — к ( — л) 1 ). Так как 

ф 2 (л) = х б — 2л 4 — 5л 3 — 8л 2 — 7х-)-3, 
ср 2 (х) = 5л 4 — 8х 3 — 15л; 2 — 16л — 7, 
ер” (х) = 20х 3 — 24л 2 — 30л — 16, 
ф 2 (л) = 60л 2 — 48л — 30, 

Ф ’ 2 Ѵ (л)= 120л — 48, 

Ф^ (л) = 120, 


а все эти многочлены положительны, как легко проверить, при х = 4, то 
число 4 служит верхней границей положительных корней для ф 2 (х), и по- 
этому число —4 будет нижней границей отрицательных корней для /г (л). 
Рассматривая, наконец, многочлены 

ф г (л) = — хЧі =3л 5 + 7л 4 — 8л 3 + 5л 2 — 2л — 1, 

фз (л) = — х в к і-^=3л 6 — 7л 4 — 8л 3 — 5л 2 — 2л + 1, 

мы найдем для них, снова применяя метод Ньютона, в качестве верхних 
границ положительных корней соответственно числа 1 и 4, а поэтому нйж- 

ней границей положительных корней многочлена к(х) служит число — = 1 , 

1 

верхней же границей отрицательных корней — число — . 

Таким образом, положительные корни многочлена й(х) расположены 
между числами 1 и 2, отрицательные корни — между числами — 4 и — . 

Этот результат очень хорошо согласуется с тем, что было найдено выше 
при рассмотрении графика. 

§ 40. Теорема Штурма 

Теперь мы перейдем к вопросу о числе действительных 
корней многочлена /(х) с действительными коэффи- 
циентами. Мы будем при этом интересоваться как общим числом 
действительных корней, так и отдельно числом положительных и 
числом отрицательных корней и вообще числом корней, заключенных 
между заданными границами а и Ь. Существует несколько методов 
для разыскания точного числа корней, причем все они весьма гро- 
моздки; среди них более удобным является метод Штурма , кото- 
рый и будет сейчас изложен. 


4 ) Мы берем — к ( — х) вместо к ( — л) потому, что для применимости 

метода Ньютона старший коэффициент должен быть положительным. На 

корни многочлена ф 2 (л) эта перемена знака не оказывает, понятно, никакого 
влияния. 
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Введем сначала одно определение, которое будет использойаться 
и в следующем параграфе. 

Пусть дана некоторая упорядоченная конечная система действи- 
тельных чисел, отличных от нуля, например 

1, 3, -2, 1, -4, -8, -3, 4, 1. (1) 

Выпишем последовательно знаки этих чисел: 

+ і + » — . + > — > — > — і + . + * (2) 

Мы видим, что в системе знаков (2) четыре раза стоят рядом проти- 
воположные знаки. Ввиду этого говорят, что в упорядоченной систе- 
ме (1) имеют место четыре перемени знаков. Число перемен 
знаков можно подсчитать, понятно, для любой упорядоченной 
конечной системы отличных от нуля действительных чисел. 

Рассмотрим теперь многочлен /( х ) с действительными коэффи- 
циентами, причем будем предполагать, что многочлен /(^) не имеет 
кратных корней, так как иначе мы могли бы его разделить 
на наибольший общий делитель его с его производной. Конечная 
упорядоченная система отличных от нуля многочленов с действи- 
тельными коэффициентами 

/(*)=/•(*). /і(*)> Л(*) /,(*) (3) 

называется системой Штурма для многочлена /(х), если выпол- 
няются следующие требования: 

1) Соседние многочлены системы (3) не имеют общих корней. 

2) Последний многочлен, А (х ) , не имеет действительных корней. 

3) Если а — действительный корень одного из промежуточных 

многочленов / к (х) системы (3), 1, то А-і( а ) и / й+1 (а) 

имеют разные знаки. 

4) Если а — действительный корень многочлена /( х ), то произ- 
ведение {{х)/ х (х) меняет знак с минуса на плюс, когда х, возра- 
стая, проходит через точку а. 

Вопрос о том, всякий ли многочлен обладает системой Штурма, 
будет рассмотрен ниже; сейчас же, предполагая, что /(х) такой 
системой обладает, покажем, как она может быть использована для 
нахождения числа действительных корней. 

Если действительное число с не является корнем данного много- 
члена /(х), а (3) — система Штурма для этого многочлена, то возь- 
мем систему действительных чисел 

/(с), А (с), А (с) А {с), 

вычеркнем из нее все числа, равные нулю, и обозначим через (с) 
число перемен знаков в оставшейся системе; будем называть № (с) 
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числом перемен знаков в системе Штурма (3) многочлена /( х ) 
при х= с ѵ ). 

Справедлива следующая 

Теорема Штурма. Если действительные числа а и Ь, 
а<іЬ, не являются корнями многочлена / (х), не имеющего 
кратных корней, то ІГ (а) 5= № (Ь) и разность № (а) — № (Ь) равна 
числу действительных корней многочлена /(х), заключенных 
между а и Ь. 

Таким образом, для определения числа действительных корней 
многочлена / (аг), заключенных между а и Ь (напоминаем, что /(х) 
по условию не имеет кратных корней), нужно лишь установить, 
насколько уменьшается число перемен знаков в системе Штурма 
этого многочлена при переходе от а к Ь. 

Для доказательства теоремы рассмотрим, как меняется число ІГ (л:) 
при возрастании х. Пока х , возрастая, не встретит корня ни одного 
из многочленов системы Штурма (3), знаки многочленов этой системы 
не будут меняться, и поэтому число IV (х) останется без изменения. 
Ввиду этого, а также ввиду условия 2) из определения системы 
Штурма, нам остается рассмотреть два случая: переход х через 
корень одного из промежуточных многочленов / к (х), 1 — 1, 

и переход х через корень самого многочлена /(х). 

Пусть а будет корнем многочлена / к (х), — 1. Тогда, 

по условию 1), Д_і(а) и / к+1 (а) отличны от нуля. Можно найти, 
следовательно, такое положительное число в, быть может и очень 
малое, что в отрезке (а — е, а + е) многочлены Д_ 1 (лг) и / к+1 (х) 
не имеют корней и поэтому сохраняют постоянные знаки, причем, 
по условию 3), эти знаки различны. Отсюда следует, что 
каждая из систем чисел 

— е ). /*(« — »). Л+і( а — »> (4) 

И 

Л-і(“ + е), Д(а + е), Л +1 (а + е) (5) 

обладает ровно одной переменой знаков независимо от того, 
каковы знаки чисел Д(а — е) и Д(а-[-е). Так, например, если мно- 
гочлен Д_! {х) на рассматриваемом отрезке отрицателен, а / к+1 (х ) 
положителен и если Д(а — е)>0, Д(а+е)<0, то системам (4) и 
(5) соответствуют системы знаков 

— т +. +; — ! — , +■ 

Таким образом, при переходе х через корень одного из промежуточ- 
ных многочленов системы Штурма перемены знаков в этой системе 


г ) Само собой разумеется, что перемены знаков в системе Штурма мно- 
гочлена / ( х ) не имеют ничего общего с переменой знака самого многочлена 
I ( х ), происходящей от прохождения х через корень этого многочлена. 



ТЕОРЕМА ШТУРМА 


249 


§ 40 ] 

могут лишь перемещаться, но не возникают вновь и не исчезают, 
а поэтому число Ш [X] при таком переходе не меняется. 

Пусть, с другой стороны, а будет корнем самого данного мно- 
гочлена /( х ). По условию 1) а не будет корнем для / х (л:). Суще- 
ствует, следовательно, такое положительное число е, что отрезок 
(а — е, а + е) не содержит корней многочлена / х (ж), а поэтому / х (х) 
сохраняет на этом отрезке постоянный знак. Если этот знак поло- 
жителен, то ввиду условия 4) сам многочлен /( х ) при переходе х 
через а меняет знак с минуса на плюс, т. е. /(а — е) < 0, /(а-|- е) > 0. 
Системам чисел 

/(а — е), / х (а — е) и /(а + е), / х (а + е) (6) 

соответствуют, следовательно, системы знаков 

— . + и + . + , 

т. е. в системе Штурма теряется одна перемена. Если же 
знак / х (л:) на отрезке (а — е, а + е) отрицателен, то снова, ввиду 
условия 4), многочлен /( х ) меняет знак с плюса на минус при пе- 
реходе х через а, т. е. /(а — е) > 0, /(а + е) <0; системам чисел (б) 
соответствуют теперь системы знаков 

+ , — и — , — , 

т. е. в системе Штурма снова теряется одна перемена. 

Таким образом, число № (х) меняется (при возрастании х) 
лишь при переходе х через корень многочлена /( х ), причем в этом 
случае оно уменьшается ровно на единицу. 

Этим доказана, очевидно, теорема Штурма. Для того чтобы 
воспользоваться ею для разыскания общего числа действительных 
корней многочлена /{х), достаточно а качестве а взять нижний 
предел отрицательных корней, в качестве Ь — верхний предел поло- 
жительных корней. Проще, однако, поступить следующим образом. 
Ввиду леммы, доказанной в § 23, существует такое положительное 
число Ы, быть может и очень большое, что при | х | > N знаки всех 
многочленов системы Штурма будут совпадать со знаками их старших 
членов. Иными словами, существует столь большое положительное 
значение неизвестного х, что знаки соответствующих ему значений 
всех многочленов системы Штурма совпадают со знаками их стар- 
ших коэффициентов; это значение х, вычислять которое нет 
необходимости, условно обозначается символом оо. Существует, 
с другой стороны, столь большое по абсолютной величине отрица- 
тельное значение х, что знаки соответствующих ему значений мно- 
гочленов системы Штурма совпадают со знаками их старших коэф- 
фициентов для многочленов четной степени и противоположны зна- 
,кам старших коэффициентов для многочленов нечетной степени; это 
значение х условимся обозначать через — оо. В отрезке ( — оо, оо) 
содержатся, очевидно, все действительные корНи всех многочленов 
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системы Штурма и, в частности, все действительные корни много- 
члена /( х ). Применяя к этому отрезку теорему Штурма, мы най- 
дем число этих корней, применение же теоремы Штурма к отрез- 
кам ( — оо, 0) и (0, оо) дает соответственно число отрицательных 
и число положительных корней многочлена /(х). 

Нам остается показать, что всякий многочлен / {х) с действитель- 
ными коэффициентами, не имеющий кратных корней, обладает 
системой Штурма. Из различных методов, используемых для 
построения такой системы, мы изложим один, наиболее употреби- 
тельный. Положим Д (х) — /' (л;), чем обеспечивается выполнение 
условия 4) из определения системы Штурма. Действительно, если 
а — действительный корень многочлена /(х), то /' (а)=^0. Если 
/'(а)>0, то /' (х)^>0 в окрестности точки, а, а поэтому / (х) ме- 
няет знак с минуса на плюс при переходе х через ос,; это же верно 
тогда и для произведения /(х) Д (л:). Аналогичные рассуждения прохо- 
дят и в случае /' (а)-<0. Делим затем /(х) нд Д (дг) и остаток от 
этого деления, взятый с обратным знаком, принимаем за 
/»<*): 

/(х) = Д (X) ^ (х) — / 2 (х). 

Вообще, если многочлены Д_ х (дг) и / к (х) уже найдены, то Д +1 (л:) 
будет остатком от деления ф к -\( х ) на Д (х), взятым с обратным 
знаком: 

А - 1 (х) = Д А) <7* А) — Д +1 А)- (7) 

Изложенный здесь метод отличается от алгоритма Евклида, при- 
мененного к многочленам /(х) и /' (х), лишь тем, что у остатка 
каждый раз меняется знак на обратный и следующее деление произ- 
водится уже на этот остаток с обратным знаком. Так как при разы- 
скании наибольшего общего делителя такая перемена знаков не 
существенна, то наш процесс остановится на некотором Д (л;), 
являющемся наибольшим общим делителем многочленов /(х) и /' (л:), 
причем из отсутствия у / (х) кратных корней, т. е. из его взаимной 
простоты с /' (лг), будет следовать, что на самом деле Д (х) является 
некоторым отличным от нуля действительным числом. 

Отсюда вытекает, что построенная нами система многочленов 

/А)=/о {х), /' (х) = Д <лг), ДА), . . . , ДА) 

удовлетворяет и условию 2) из определения системы Штурма. Для 
доказательства выполнения условия 1) предположим, что соседние 
многочлены ДА) и Д +1 А) обладают общим корнем а. Тогда, 
по (7), а будет корйем и для многочлена Д_ 1 {х). Переходя к ра- 
венству 

Д-2 А) = Д-1 А) Чк-\ ( х ) А А), 

мы получим, что а служит корнем и для Д_ 2 А)- Продолжая далее, 
мы получим, что а служит общим корнем для /(дг) и /' (х), что 
противоречит, однако, нашим предположениям. Наконец, выполнение 
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§ 40] 

условия 3) вытекает непосредственно из равенства (7): если / А (а) = 0, 
т0 /к-і( а )= -Л + і( а )- 

Применим метод Штурма к рассматривавшемуся в предыдущем пара- 
графе многочлену 

к{х) = х 5 + 2а 4 — 5а 3 + 8а 2 — 7х — 3. 

Мы не будем при этом предварительно проверять, что к ( х ) не имеет крат- 
ных корней, так как метод построения системы Штурма, изложенный выше, 
одновременно служит для проверки взаимной простоты многочлена и его 
производной. 

Найдем систему Штурма для к{х), применяя указанный метод. При этом 
в процессе деления мы будем, в отличие от алгоритма Евклида, умножать 
и сокращать лишь на произвольные положительные числа, так как 
знаки остатков играют в методе Штурма основную роль. Мы получим такую 
систему: 

к (х) = х 6 + 2х 4 — 5а 3 4-8а 2 — 7*— 3, 

^ (х) — 5 а 4 + бх 3 — 15 а 2 4* 16х — 7, 
к г (А) = 66а 3 — 150а 2 4- 172а 4- 61 , 
к 3 (а) = — 464а 2 4- 1 135а 4- 723, 

Л 4 (а) = — 32 599 457а — 8 486 093, 

К (а) == — 1. 

Определим знаки многочленов этой системы при х — — оо и а=оо, для 
чего, как было указано, следует смотреть лишь на знаки старших коэффи- 
циентов и на степени этих многочленов. Мы получим такую таблицу: 



Л (А) 

К (*) 

К (а) ^ 

к 3 (х) 

Ма) 

К (*) 

Число пере- 
мен знаков 

00 

— 

+ 

— 

— 

+ 

— 

4 

00 

+ 

+ 

+ 

— 

— 

— 

1 


Таким образом, при переходе а от — оо к со система Штурма теряет 
три перемены знаков, а поэтому многочлен к (а) имеет ровно три действи- 
тельных корня. Отсюда видно, что при построении в предыдущем параграфе 
графика этого многочлена мы не упустили ни одного из корней. 

Применим метод Штурма к другому многочлену, более простому. Пусть 
дан многочлен 

I (х) = х 3 +3х 2 — 1. 

Найдем число его действительных корней, а также целые границы, между 
которыми каждый из этих корней расположен, причем не будем строить 
заранее графика этого многочлена. 

Система Штурма для многочлена I (а) будет 

} (а) = а 3 4- За 2 — 1 
[і (а) = За 2 4- 6а, 

/а (а) = 2х 4- 1 , 

/*(А)=1. 
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Найдем число перемен знаков в этой системе при х = — оо и я = оо 



/м 

/і ( X ) 

к м 

к ( х ) 

Число перемен 
знаков 

00 

— 

+ 


+ 

3 

00 

+ 

+ 

+ 

+ 

0 


Л'ногочлен / (*) обладает, следовательно, тремя действительными корнями. 
Для более точного определения положения этих корней продолжим преды- 
дущую таблицу: 



1 (•*) 

І1 {X) 

к(х) 

/з (х) 

Число пере- 
мен знаков 

‘ 

— 3 


+ 

— 

+ 

3 

*= — 2 

+ 

0 


4" 

2 

х = — 1 


— 

— 

+ 

2 

* = 0 

— 

0 

+ 

+ 

і 

Х= 1 

+ 

+ 

+ 

+ 

1 

0 


Таким образом, система Штурма многочлена 1(х) теряет по одной 
перемене знаков при переходе х от — 3 к — 2, от — 1 к 0 и от 0 к 1. 
Корни а 1г а 2 и а 3 этого многочлена удовлетворяют, следовательно, нера- 
венствам: 

— 3<а 1 <— 2, — 1<а 2 <0, 0<а г <1. 


§ 41. Другие теоремы о числе действительных корней 

Теорема Штурма полностью решает вопрос о числе действи- 
тельных корней многочлена. Ее существенным недостатком является, 
однако, громоздкость вычислений, выполняемых при построении 
системы Штурма, как читатель мог убедиться, проделав все вычи- 
сления, относящиеся к первому из рассмотренных выше примеров. 
Ввиду этого сейчас будут доказаны две теоремы, не дающие точ- 
ного числа действительных корней, а лишь ограничивающие это 
число сверху. Эти теоремы, применяемые после того, как при 
помощи графика число действительных корней уже ограничено 
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снизу, позволяют иногда найти точное число действительных кор- 
ней, не прибегая к методу Штурма. 

Пусть дан многочлен /( х ) п - й степени с действительными коэф- 
фициентами, причем допускаем, что он может обладать кратными 
корнями. Рассмотрим систему его последовательных производных 

/(х) =/ (0) (х), Г (X), /" (*), ■ - - / и - 1> (*), Г (X), (1) 

из которых последняя равна старшему коэффициенту а 0 многочлена 
/( х ), умноженному на л!, и поэтому все время сохраняет постоян- 
ный знак. Если действительное число с не служит корнем ни одного 
из многочленов системы (1), то обозначим через 5 (с) число перемен 
знаков в упорядоченной системе чисел 

/(С), /'(С), г (с), .... /"-"(с), /">(*)• 

Таким образом можно рассматривать целочисленную функцию 5 (л:), 
определенную для тех значений х, которые не обращают в нуль 
ни одного из многочленов системы (1). 

Посмотрим, как меняется число 5 (х) при возрастании х. Пока х 
не пройдет через корень ни одного из многочленов (1), число 5 (х) 
не может измениться. Ввиду этого мы должны рассмотреть два 
случая: переход х через корень многочлена /(х) и переход х через 
корень одной из производных / <Л) (х), ]^к^п— 1. 

Пусть а будет /-кратный корень многочлена /(х), /^1, т. е. 

/(а) =/' (а) = . . . (а) =0, /<*> (а)=*0. 

Пусть положительное число е столь мало, что отрезок (а — е, а+ е) 
не содержит корней многочленов /(х), /' {х), , . . , / і1 ~ ѵ (х), отлич- 
ных от а, а также не содержит ни одного корня многочлена / {1) (х). 
Докажем, что в системе чисел 

/(а — в), /'(а— 8), ..., / ,/ - 1) (а— е), / а >(а— е) 

всякие два соседних числа имеют противоположные знаки, тогда 
как все числа 

/(а 4-е), /(а 4-е), ..., Х 1 » (а + б), / и >(а+е) 

имеют один и тот же знак. Так как каждый из многочленов си- 
стемы (1) является производной от предыдущего многочлена, то нам 
нужно лишь доказать, что если х проходит через корень а много- 
члена ./(ж), то, независимо от кратности этого корня, до перехода 
/(х) и /' (х) имели разные знаки* а после перехода их знаки сов- 
падают. Если /(а — е)>0, то /(х) убывает на отрезке (а — е, а), 
а потому /'(а — е)«<0; если же /(а — е)< 0, то /( х ) возрастает, 
и потому /' (« — е)>0. В обоих случаях, следовательно, знаки раз- 
личны. С другой стороны, если /(«-(- е)>0, то /(х) возрастает на 
отрезке (а, а е), а потому /' (а 4- е)>0; аналогично из/(а+еХ0 
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следует /' (а + е) ■< 0. Таким образом, после перехода через корень 
а знаки /(х) и /' (я) должны совпадать. 

Из доказанного следует, что при переходе х через /-кратный 
корень многочлена /(л:) система 

/(X), /'(X), ..., г г '»(х), /">(*) 

теряет / перемен знаков. 

Пусть а будет теперь корнем производных 

/*>(*), / ( * +1, (*)> .... / ,л+| - и (лс) | /> 1, 

но не служит корнем ни для / ік ~ 1) (х), ни для / ік+1) (х). По дока- 
занному выше, переход х через а влечет за собой потерю в системе 

/ {Ь) (Х ), /* +1) (*), / ,А+г - 1 >(дг), / < 4 + '> (X) 

I перемен знаков. Правда, этот переход создает, возможно, новую 
перемену знаков между (х) и / (к) (х), ^однако, ввиду 1, 

при переходе х через а число перемен знаков в системе 

/ <А-1> (лг), / <к> (х ), / ! * +1 >(*), .... 

или не меняется, или же уменьшается. Оно может уменьшиться при 
этом лишь на четное число, так как многочлены / {к ~ 1) (х) и / ік + 1) {х) 
не меняют своих знаков при переходе х через значение а. 

Из полученных результатов вытекает, что если числа а и Ь, 
а<іЬ, не являются корнями ни для одного из многочленов си- 
стемы (1), то число действительных корней многочлена /(х), 
заключенных между а и Ь и подсчитываемых каждый столько 
раз, какова его кратность, равно разности 5 (а) — 5 (Ь) или 
меньше этой разности на четное число. 

Для того чтобы ослабить ограничения, наложенные на числа а 
и Ь, введем следующие обозначения. Пусть действительное число с 
не^является корнем многочлена /(х), хотя, быть может, служит 
корнем для некоторых других многочленов системы (1). Обозначим 
через 5 + (с) число перемен знаков в системе чисел 



/(С), /'(с), /" (С), ..., /'"-“(с), /”>(с), 

(2) 

подсчитываемое следующим образом: если 



/*> (с)=/ ( * +1 > (с)= ... =/<*+'-1>(с) = 0, 

(3) 

но 




/ к -»(с)ф0, /*+'> (с)^0, 

(4) 


то считаем / {к) (с), / (А+1) (с), / {к+1 ~ ѵ (с) имеющими такой же 

знак, как у / <к+г> (с); это равносильно, очевидно, тому, что при 
подсчете числа перемен знаков в системе [2) нули предполагаются 
вычеркнутыми. С другой стороны, через 5_ (с) обозначим число 
перемен знаков в системе (2), подсчитываемое следующим образом: 
если имеют место условия (3) и (4), то считаем, что / |й+,) (с), 
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— 1, имеет такой же знак, как и / (к+1) {с), если разность 
I — і четная, и противоположный знак, если эта разность нечетная. 

Если мы хотим теперь определить число действительных корней 
многочлена /( х ), заключенных между а и Ь, а <6, причем а и Ь не 
являются корнями /{х), но служат, быть может, корнями для других 
многочленов системы (1), то поступаем следующим образом. Пусть е 
столь мало, что отрезок ( а , а + 2е) не содержит корней много- 
члена /( х ), а также отличных от а корней всех остальных много- 
членов системы (1); с другой стороны, пусть т) столь мало, что 
отрезок ( Ь — 2ц, Ь) также не содержит корней /(х) и отличных от 
Ь корней остальных многочленов системы (1). Тогда интересующее 
нас число действительных корней многочлена / (лг) будет равно числу 
действительных корней этого многочлена, заключенных между а + е 
и Ь — г], т. е., по доказанному выше, равно разности 5{а-)-е) — 
— 5(6 — т]) или меньше этой разности на четное число. Легко ви- 
деть, однако, что 

5(в + в) = 5 + (а), 5(Ь-ц) = 8_(Ь). 

Этим доказана следующая 

Теорема Бюдана — Фурье. Если действительные числа а 
и Ь, а <.Ъ, не являются корнями многочлена /(х) с действитель- 
ными коэффициентами, то число действительных корней этого 
многочлена, заключенных между а и Ь и подсчитываемых ка- 
ждый столько раз, какова его кратность, равно разности 
5 + (а) — - 5_ (Ь) или меньше этой разности на четное число. 

Обозначим символом оо столь большое положительное значение 
неизвестного х, что знаки соответствующих ему значений всех много- 
членов системы (1) совпадают со знаками их старших коэффициен- 
тов. Так как этими коэффициентами будут последовательно числа 
а 0 , па 0 , п(п — 1 ) а 0 , п\а й , знаки которых совпадают, то 

5 (сю) = 5_ (оо) = 0. С другой стороны, так как 

/(0) = а п , /'(0) = «._!, Г (0) = а а _ 2 2\, 

/'"(0) = а„- 3 3!, .... Г щ (0) = а 0 -п\, 

где а 0 , а 1 , а п — коэффициенты многочлена /{х), то 5 + (0) со- 

впадает с числом перемен знаков в системе коэффициентов много- 
члена /{х), причем коэффициенты, равные нулю, не учитываются. 
Таким образом, применяя теорему Бюдана — Фурье к отрезку (0, оо), 
мы приходим к следующей теореме: 

Теорема Декарта. Число положительных корней много- 
члена /{х), засчитываемых каждый столько раз, какова его 
кратность, равно числу перемен знаков в системе коэффициен- 
тов этого многочлена (причем равные нулю коэффициенты не 
учитываются) или меньше этого числа на четное число. 

Для определения числа отрицательных корней многочлена /(х) 
достаточно, очевидно, применить теорему Декарта к многочлену 
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/( — х ). При этом, если ни один из коэффициентов многочлена /( х ) 
не равен нулю, то, очевидно, переменам знаков в системе коэффи- 
циентов многочлена /( — х) соответствуют сохранения знаков 
в системе коэффициентов многочлена /( х ) и обратно. Таким образом, 
если многочлен /(х) не имеет равных нулю коэффициентов, то 
число его отрицательных корней (считаемых с их кратностями) 
равно числу сохранений знаков в системе коэффициентов или 
меньше его на четное число. 

Укажем еще одно доказательство теоремы Декар- 
та, не опирающееся на теорему Бюдана — Фурье. Докажем сначала 
следующую лемму: 

Если с> 0, то число перемен знаков в системе коэффициен- 
тов многочлена ф(х) меньше числа перемен знаков в системе 
коэффициентов произведения {х — с)/(х) на нечетное число. 

Действительно, собирая в скобки стоящие рядом члены одного 
знака, запишем следующим образом многочлей /(л:), старший коэф- 
фициент а 0 которого считаем положительным: 

/(х) — (аоХ п Ь х х к ‘ +1 ) — (а х х к ' Ь 2 х к ** 1 ) 

. 1Па/‘+.-. +Ь 5+1 х*). (5) 

Здесь а 0 >0, О, ..V, <^>0, в то время как Ь ІУ Ь г , . .., Ь г 
положительны или равны нулю; однако ^ +1 считаем строго поло- 
жительным, т. е. X х у где 0, является наименьшей степенью неиз- 
вестного х, входящей в многочлен /( х ) с отличным от нуля коэф- 
фициентом. Скобка 

(аоХ п + # 1 дг*‘ + 1 ) 

случайно может состоять при этом лишь из одного слагаемаго, 
а именно тогда, когда к 1 -\-\=п. Аналогичное замечание приме- 
нимо и к другим скобкам формулы (5). 

Запишем теперь многочлен, равный произведению (л; — с)/(х) у 
причем будем выделять лишь члены, содержащие х в степенях 
л+1, к х -\- 1, ..., ^ + 1 и і. Мы получим: 

(х — с)/{х) = (а 0 х п ^+. . .)_( а ;^. +1 + 

• • • +(— 1) , (а^* +1 + . . . —сЬ 1+1 х 1 ), (6)' 

где а { =а і -\-сЬ і , і= 1, 2, ..., 5, и поэтому, так как с > 0, все а. 
строго положительны. Таким образом, в системе коэффициентов 
многочлена /(х) между членами а 0 х п и — а х х к < (а также между чле- 
нами — а х х к > и а 2 х к і и т. д.) была одна перемена знаков, а у мно- 
гочлена (х — с)/(х) между соответствующими членами а 0 х п ' +1 и 
— а'лг* +1 (соответственно между членами — а' х х к > + І и а 2 х к * + 1 и т. д.) 
будет или одна перемена знаков, или больше, но тогда непременно 
на четное число. Точные места этих перемен знаков нас не будут 
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при этом интересовать; может случиться, например, что коэффициент 
при х к і +2 в (6) отрицателен, как и коэффициент — а х , а поэтому 
между этими двумя соседними коэффициентами нет перемены знаков, 
т. е. в первой скобке перемены знаков расположены где-то раньше. 
Заметим теперь, что последняя скобка в (5) не содержала никаких 
перемен знаков, в то время как последняя скобка в (6) их содержит, 
притом нечетное число: достаточно учесть, что последние отлич- 
ные от нуля коэффициенты многочленов /( х ) и (х — с)/(х), т. е. 
( — и ( — 1)* +1 ^+і с - имеют разные знаки. Таким образом, 
при переходе от /(х) к (х — с)/(х) общее число перемен знаков 
в системе коэффициентов непременно увеличивается, притом на 
нечетное число (сумма нескольких слагаемых, одно из которых 
нечетно, а остальные четны, будет, понятно, нечетной!). Лемма 
доказана. 

Для доказательства теоремы Декарта обозначим через 
а х , а 2 , ..., а к все положительные корни многочлена /( х ). Таким 
образом, 

/(х) = (х— а к ) (*— а 2 ) . . . (х—а к ) ср (*), 

где <р (х) — многочлен с действительными коэффициентами, уже не 
имеющий положительных действительных корней. Отсюда следует, 
что первый и последний отличный от нуля коэффициенты много- 
члена ф (х) одного знака, т. е. система коэффициентов этого много- 
члена содержит четное число перемен знаков. Применяя теперь дока- 
занную выше лемму последовательно к многочленам 

ф (*)> (*— %) ф (*), (х—а 1 )(х~а 3 )(р(х), /(х), 

мы получим, что число перемен знаков в системе коэффициентов 
каждый раз увеличивается на нечетное число, т. е. на единицу плюс 
четное число, а поэтому число перемен знаков в системе коэффи- 
циентов многочлена / (х) больше числа к на четное число. 

Применим теоремы Декарта й Бюдана — Фурье к рассматривавшемуся 
выше многочлену 

к (х) = X 8 + 2х* — 5г> + 8х* — 7х — 3. 

Число перемен знаков в системе коэффициентов равно трем, и поэтому, 
по теореме Декарта, к(х) может иметь три или один положительный корень. 
С другой стороны, к(х) не имеет равных нулю коэффициентов, а так как 
в системе коэффициентов два сохранения знаков, то к (х) либо имеет два 
отрицательных корня, либо не имеет ни одного. Сравнивая с результатами, 
полученными ранее при помощи графика, мы получаем, что два есть точное 
число отрицательных корней нашего многочлена. 

Для точного определения числа положительных корней воспользуемся 
теоремой Бюдана — Фурье, причем применим ее к отрезку (1, оо), так как 
в § 39 уже было показано, что 1 служит нижней границей положительных 
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корней многочлена к (я). Последовательные производные к (х) также уже 
были выписаны в § 39. Найдем их знаки при х=1 и х«=оо! 



к(х) 

к' (х) 

к"(х) 

к"’{х) 

Д ,ѵ (х) 

й ѵ (X) 

Число пере- 
мен знаков 

х — 1 


+ 

+ 

+ 

+ 

+ 

і 

Х= ОО 

+ 

+ 

+ 

+ 

+ 

+ 

0 


Отсюда следует, что система производных теряет при переходе х от 1 до оо 
одну перемену знаков, а поэтому к(х) имеет ровно один положительный 
корень. 

В связи с этим примером заметим, что вообще при разыска- 
нии числа действительных корней многочлена сле- 
дует начинать с построения графика и применения 
теорем Декарта и Б ю дана — Фурье, лишь в крайних 
случаях переходя к построению системы Штурма. 

Теорема Декарта допускает некоторое уточнение в том частном 
случае, когда заранее известно, что все корни многочлена действи- 
тельные, как это имеет место, например, для характеристического 
многочлена симметрической матрицы. Именно: 

Если все корни многочлена ф(х) действительные, а свободный 
член отличен от нуля, то число к х положительных корней 
этого многочлена равно числу з х перемен знаков в системе 
его коэффициентов, а число к 2 отрицательных корней равно 
числу $ 2 перемен знаков в системе коэффициентов многочлена 
/(-х). 

Действительно, при наших предположениях 

К +Ь % = п, (7) 

где п — степень многочлена /(х), и, по теореме Декарта, 

к х гзд в х , к 2 5 а . (8) 

Докажем, что 

Доказательство будем вести индукцией по п, так как при п~\ 
ввиду а 0 фО, а х Ф 0 перемена знаков имеется лишь у одного 
из многочленов 

/(х) = а а х + а 1 , /( — *) = — ао* + Яі, 

т. е. для этого случая =«1. Пусть формула (9) уже доказана 

для многочленов, степень которых меньше п. Если 

/ (х) = а 0 х п + а п _ ( х 1 + а„, 
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где — 1, а п _ ь Ф 0, то положим 
ё(х) = а п _ іХ 1 + 

Тогда 

/(х) = а е х п + $ (.г), /{— х) = (— 1 ) п а 0 х п + § (— х). 

Если и будут соответственно числа перемен знаков в системах 
коэффициентов многочленов § (х) и — х), то, по индуктивному 
предположению (ясно, что /^1), 

-Ь $2 I- 

Если /=л — 1, то перемена знаков на первом месте, т. е., для /(х), 
между а 0 и а 1 = а п _ [ будет лишь у одного из многочленов /(х), 
/( — х), а поэтому 

-4- $2 == $ 1 "Ф ^ 2 “ф ^ I -|— 1 П. 

Если же л — 2, то возможны перемены знаков на первых местах 
у каждого из многочленов /(х), /( — лг), однако и в этом случае 

-ф 5 2 ^ -ф 5 2 -ф 2 '-4 / -|- 2 '-4 (л — 2) ф- 2 = л. 
Сопоставляя (7),- (8) и (9), получаем, что 

Йі = 5 1 , &2 = 5 2) 

что и требовалось доказать. 

§ 42. Приближенное вычисление корней 

Изложенные в предшествующих параграфах методы позволяют 
произвести отделение действительных корней многочлена / (х) 
с действительными коэффициентами, т. е. для каждого из корней 
указать границы, между которыми находится только один этот 
корень. Если эти границы достаточно узки, то любое число, заклю- 
ченное между ними, можно считать приближенным значением иско- 
мого корня. Таким образом, после того как методом Штурма (или 
каким-либо другим, более экономным способом) будет установлено, 
что между рациональными числами а и Ь содержится лишь 
один корень многочлена /( х ), остается задача настолько сузить эти 
границы, чтобы новые границы а' и Ъ' обладали наперед заданным 
числом совпадающих первых десятичных знаков; этим искомый 
корень будет вычислен с заданной точностью. 

Существует много методов, позволяющих достаточно быстро 
находить приближенное значение корня с требуемой точностью. Мы 
укажем два из них, теоретически более простые и общие и при 
совместном употреблении достаточно быстро приводящие к цели. 
Следует заметить, что методы, которые будут сейчас изложены, 
применимы не только к многочленам, но и к более широким классам 
непрерывных функций. 

Будем считать дальше, что а. есть простой корень многочлена 
/{х), так как от кратных корней мы всегда можем освободиться, 
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и что корень а уже отделен границами а и Ь , а<_а<.Ь; отсюда 
следует, в частности, что /(а) и /{Ь) имеют разные знаки. 

Метод линейной интерполяции (называемый также методом 
ложного положения). В качестве приближенного значения 
корня а можно было бы принять, например, полусумму границ а 
, а Ъ 

и о, — н— , т. е. середину отрезка, имеющего концами а и Ъ. Более 

естественно, однако, предположить, что корень лежит ближе к той 
из границ а, Ь, которой соответствует меньшее по абсолютной вели- 
чине значение многочлена. Метод линейной интерполяции состоит 
в том, что в качестве приближенного значения корня а берется 
число с, делящее отрезок (а, Ь) на части, пропорциональные абсо- 
лютным величинам чисел /(а )\ и /(/?), т. е. 

с— а_ На ) . 

Ь—с НН' 


знак минус в правой части поставлен ввиду того, что /(а) и /(Ь) 
имеют разные знаки. Отсюда 


„ Ь[ (а) — аі (Ь) 

Ш-ПЬ) ■ 


( 1 ) 


Геометрически, как показывает рис. 10, метод линейной интер- 
поляции заключается в том, что на отрезке (а, Ь) кривая у=*/(х) 

заменяется ее хордой, соединяющей точ- 
ки А (а, /(а)) и В(Ь,/(Ь)), и в качестве 
приближенного значения корня а прини- 
мается абсцисса точки пересечения этой 
хорды с осью х. 

Метод Ньютона. Так как а-— простой 
корень многочлена / (ж), то /'(а) Ф 0. При- 
мем, что также и /” (а) ф 0, так как иначе 
вопрос сводится к вычислению корня мно- 
гочлена /' (х), имеющего меньшую сте- 
пень, чем /(х). Примем, далее, что отре- 
зок (а, Ь ) не только не содержит корней 
/( х ), отличных от а, но и не содержит ни 
одного корня многочлена /' (*), а также и многочлена /' (х ) х ). 
Таким образом, как следует из курса математического анализа, 
кривая у~/(х) на отрезке (а, Ь) либо монотонно возрастает, ли- 
бо монотонно убывает, а также либо во всех точках этого 
отрезка обращена выпуклостью вверх, либо во всех точках об- 
ращена выпуклостью вниз. В расположении кривой на отрезке (а, Ь) 



Сужение границ, приводящее к тому, что это условие будет удовле- 
творяться, достигается обычно без всяких затруднений, так как методы, 
изложенные ранее, позволяют установить число корней многочленов (х) 
и Г (х) в любом отрезке. 
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могут встретиться, следовательно, четыре случая, представленных 
на черт. 1 1 — 14. 

Обозначим через а 0 тот из пределов а и Ь, в котором знак /( х ) 
совпадает со знаком /" ( х ). Так как /(а) и /(Ь) имеют разные 
знаки, а /" (х) сохраняет знак на всем отрезке (а, Ь), то такое а й 
может быть указано. В случаях, представленных на рис. 11 и 14, 



Рис. 11. Рис. 12. 


будет а о = 0> в двух других случаях а 0 — Ь. В точке кривой у —/(х) 
с абсциссой а 0 , т. е. в точке с координатами ( а 0 , /{«о)), проведем 
касательную к этой кривой и обозначим через й абсциссу точки 
пересечения этой касательной с осью х. Рис. 11 — 14 показывают, 



Рис. 13. Рис. 14. 


что число й можно считать приближенным значением корня а. Метод 
Ньютона состоит, следовательно, в замене кривой у=/(х) на от- 
резке (а, Ь) ее касательной в одной из границ этого отрезка. Усло- 
вие, наложенное на выбор точки о 0 > очень существенно: рис. 15 
показывает, что без соблюдения этого условия точка пересечения 
касательной с осью х может вовсе не давать приближения к иско- 
мому корню. 
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Выведем формулу, по которой разыскивается число й. Как 
известно, уравнение касательной к кривой у — /(х) в точке (а 0 , /(во)) 
может быть записано в виде 

У—/(<іо)=/’ («о) (х — а 0 ). 

Подставляя сюда координаты (й?, 0) точки пересечения касательной 
с осью х, получим: 

— / («о) («о) (й — «о), 

откуда 

‘'-“"-тет- (2) 

Если читатель соединит^ на рис. 11 — 14 точки Л и 5 хордами, 
то обнаружит, что методы линейной интерполяции и Ньютона 



Рис. 15. 


во всех случаях дают приближение к истинному значению 
корня а с разных сторон . Целесообразно поэтому, если отре- 
зок {а, Ь) уже таков, как это тре- 
буется в методе Ньютона, комби- 
нировать эти два метода. Мы 
получим этим путем много более 
тесные границы с и й для корня а. 
Если они еще не дают требуемой 
точности приближения, то к этим 
пределам следует еще раз приме- 
нить указанные оба метода (см. 
рис. 16) и т. д., причем можно 
доказать, что этот процесс действи- 
р ис іб. тельно позволяет вычислить корень а 

с любой точностью. 

Применим эти методы к рассматривавшемуся в предшествующих пара- 
графах многочлену 

Н(х)=х в + 2х 4 — 5л: 3 + 8х г — 7х — 3. 
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Мы знаем, что этот многочлен обладает простым корнем а 1; заключен- 
ным в границах 1 < а х <2. Можно сказать заранее, что эти границы 
слишком широки для того, чтобы методы линейной интерполяции и Ньютона, 
примененные лишь по одному разу, могли дать хороший результат. Приме- 
ним их, однако, чтобы иметь один пример, не требующий сложных вычи- 
слений. 

Как мы видели в предшествующем параграфе, при х = 1 производные 
к' (х), Л" (дс) , ... , А ѵ (х) получают положительные значения. Отсюда следует, 
на основании результатов §39, что значение х — 1 служит для к' (х), 
а также и для А" (х) верхней границей положительных корней. Отрезок (1,2) 
не содержит, следовательно, корней этих производных, а поэтому к нему 
можно применить метод Ньютона. Кроме того, Л" (х) всюду в этом отрезке 
положительна, а так как 

А (1) = — 4, Л (2) = 39, 


то нужно принять 
получаем: 


а 0 = 2. Учитывая, что А' (2) = 109, мы по формуле (2) 


а 




1,64... 


С другой стороны, формула (1) дает: 

2-(— 4)— 1-39 


с = - 


—4 — 39 


=^=1,09... 


43 


и, следовательно, корень а х заключен в границах 

1,09 < а* < 1,65. 

Мы получили слишком незначительное сужение границ для того, чтобы 
признать этот результат удовлетворительным. Конечно, к вновь полученным 
границам можно было бы еще раз применить наши методы. Целесообразно, 
однако, с самого начала найти для % достаточно тесные границы, например 
с точностью до 0,1 или даже 0,01, и лишь затем применять эти методы. Это 
сразу сделает, понятно, все вычисления весьма громоздкими, но при решении 
конкретных задач, требующих достаточно точного знания корней многочлена, 
на это приходится идти. 

Вернемся к нашему многочлену Л (х) и его корню причем заметим, 
что все значения многочленов, приводимые ниже, вычисляются методом Гор- 
нера. Так как 

Л (1,3)=— 0,13987, Л (1,31) = 0,0662923851, 
то 

1,3 < С*! < 1,31, 

т. е. мы нашли значение корня с точностью до 0,01. Применим теперь 
к этим новым границам метод линейной интерполяции: 

1,31 -( — 0,13987) — 1,3-0,0662923851 0,26940980063 

С= “ —0,13987—0,0662923851 ~ 0,2061623851 

Применим к этим же границам метод Ньютона, причем следует поло- 
жить а 0 = 1,31. Так как 

А' (1,31) =20,92822405, 
то 

, , 0,0662923851 27,3496811204 , , псос , 

Й ,сИ 20,92822405 "“ 20,92822405 

Таким образом, 

1,30678 < % < 1,30684, 

и поэтому, полагая <х х = 1,30681, мы сделаем ошибку, меньшую чем 0,00003. 
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Мы не показали до сих пор, что изложенные выше методы на 
самом деле позволяют вычислить корень с любой точностью, т. е. 
не доказали сходимости этих методов. Докажем это хотя бы для 
метода Ньютона. 

Пусть, как и выше, простой корень а многочлена /( х ) содер- 
жится в отрезке (а, Ь), выбранном так, как это необходимо для при- 
менения метода Ньютона. Отсюда следует, в частности, существова- 
ние таких положительных чисел А а В, что всюду на отрезке {а, Ь) 

!/'(*)[> А |/" (х) [ < Д. (3) 

Введем обозначение 



и положим, что 

С(Ь-а)С 1. (4) 

Для выполнения этого неравенства придется^ возможно, заменить 
границы (а, Ь) корня а более узкими границами; это не отразится, 
однако, на справедливости неравенств (3). Пусть а 0 будет та из гра- 
ниц а, Ь, в которой следует применять метод Ньютона. На основа- 
нии формулы (2) мы последовательно получим в качестве прибли- 
женных значений корня а числа а х , а 2 ,..., а к , лежащие 
в отрезке (а, Ь) и связанные между собой равенствами 



НЧ-і) 

к 1' (Ч-д ’ 

А=1, 2, ... 

(5) 

Пусть 





а—а к + к к , к— 0, 

1, 2, ... 

(6) 

Тогда 





О — / (а) — / (а к ) + Н к / (а к )ф-^- /* ( а к 4- Ѳй А ) , 


где 0<Ѳ<1. Так как /’ (а к ) ф 0 ввиду условия, наложенного 
на отрезок (а, к), то, учитывая (5) и (6), получим: 


К Пч + Щ) _ 
2 I' (ч) 

Отсюда 

|А* + і| = А * 

Таким образом, 


Пч) 


к 1 Г (<**) 

Г ( а н 4 6 н к ) 

Ч/ ( ч ) 


„ (. *<«*>\ 

V я * ГЙГ/ а а ь+і- к к+і- 


<Н\ Та = СНІ к = 0,1,2,. 


|А* +1 \<Ск\ <СЧ1_ Г <ОкІ_ 2 <. . .<^ А+1 -ій 0 2А+1 


или, так как | ко | = [а— а 0 [ < Ь — а, 

I ѴіКС-МС^-а)] 2 ^ 1 , * = 0, 1, 2,... 


( 7 ) 
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Отсюда, ввиду условия (4), следует, что разность Н к между кор- 
нем а и его приближенным значением а к , полученным последова- 
тельным применением метода Ньютона , стремится к нулю при 
возрастании к, что и требовалось доказать. 

Отметим, что формула (7) дает оценку погрешности для 
(А-(-І)-го шага, что существенно, если метод Ньютона применяется 
один, а не в комбинации с методом линейной интерполяции. 

В курсах теории приближенных вычислений читатель может 
познакомиться со способами более рационального расположения 
вычислений в изложенных выше методах, облегчающими их приме- 
нение. В этих же курсах можно найти изложение многих других 
методов приближенного вычисления корней. Среди них наиболее 
совершенным является метод Лобачевского (иногда ошибочно назы- 
ваемый методом Греффе). Этот метод позволяет находить прибли- 
женные значения всех корней сразу, в том числе и комплексных, 
причем не требует предварительного отделения корней; он свя- 
зан, однако, с весьма громоздкими вычислениями. В основе этого 
метода лежит излагаемая ниже, в гл. 11, теория симметрических 
многочленов. 



ГЛАВА ДЕСЯТАЯ 

ПОЛЯ И МНОГОЧЛЕНЫ 

§ 43. Числовые кольца и поля 

В очень многих предшествующих разделах курса мы оказывались 
в следующем положении: излагая материал, мы допускали к рас- 
смотрению или любые комплексные числа, или же только действи- 
тельные числа, но затем должны были делать замечание, что 
полученные результаты остаются справедливыми, если ограничиться 
лишь действительными числами (или, соответственно, что они 
дословно переносятся на случай любых комплексных чисел). Как 
правило, во всех этих случаях можно было заметить, что изложенная 
теория полностью сохранилась бы и в том случае, если бы мы 
допустили к рассмотрению лишь рациональные числа. Настало время 
показать читателю истинные причины этого параллелизма с тем, 
чтобы излагать дальнейший материал в естественной для него 
общности, т. е. на общепринятом алгебраическом языке. С этой" 
целью мы введем понятие поля, а также более широкое, но в нашем 
курсе играющее лишь служебную роль, понятие кольца. 

Очевидно, что системы всех комплексных, всех действительных 
и всех рациональных чисел, равно как и система всех целых чисел, 
обладают тем общим свойством , что в каждой из них не только 
сложение и умножение , но и вычитание можно выполнять , 
оставаясь в пределах самой этой системы. Это свойство указан- 
ных числовых систем отличает их, например, от системы положи- 
тельных целых или положительных действительных чисел. 

Всякая система чисел, комплексных или, в частности, действитель- 
ных, содержащая сумму, разность и произведение любых двух своих 
чисел, называется числовым кольцом. Таким образом, системы всех 
целых, рациональных, действительных и комплексных чисел являются 
числовыми кольцами. С другой стороны, никакая система положи- 
тельных чисел не будет кольцом, так как если а и Ь — два раз- 
личных положительных числа, то либо а — Ь,пнбоЬ — а отрицательно. 
Не будет кольцом и никакая система отрицательных чисел хотя бы 
потому, что произведение двух отрицательных чисел положительно. 

Числовые кольца далеко не исчерпываются рассмотренными выше 
четырьмя примерами. Сейчас будут указаны некоторые другие при- 
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§ 431 

меры, причем проверка утверждения, что рассматриваемая система 
чисел действительно является кольцом, каждый раз предоставляется 
читателю. 

Четные числа составляют кольцо; вообще при любом натураль- 
ном п совокупность целых чисел, нацело делящихся на п, будет 
кольцом. Нечетные числа кольца не составляют, так как сумма двух 
нечетных чисел четна. 

Кольцом будет совокупность рациональных чисел, знаменатели 
записей которых в виде несократимой дроби являются какими-либо 
степенями числа 2; к этой совокупности принадлежат, в частности, 
всецелые числа, так как их несократимые записи имеют знаменателем 
число 1, т. е. два в нулевой степени. В этом примере вместо числа 2 
можно взять, конечно, любое простое число р. Вообще, беря любое 
множество простых чисел, конечное или даже бесконечное, и рас- 
сматривая систему рациональных чисел, знаменатели несократимых 
записей которых могут делиться лишь на простые числа, принадле- 
жащие к взятому множеству, мы также получим кольцо. С другой 
стороны, совокупность рациональных чисел, знаменатели несократи- 
мых записей которых не делятся на квадрат никакого простого числа, 
не будет кольцом, так как указанное свойство чисел не сохраняется 
при их умножении. 

Переходим к примерам числовых колец, не лежащих целиком 
в кольце рациональных чисел. Совокупность чисел вида 

а Ь У 2, (1 ) 

где а и Ь — любые рациональные числа, будет кольцом; к этому 
кольцу принадлежат, в частности, все рациональные числа (при Ь — 0), 
а также само число У 2 (при а = 0, Ь= 1). Мы получили бы также 
кольцо, если бы ограничились лишь числами вида (1) с целыми 
коэффициентами а, Ь. В этих примерах можно, конечно, вместо 
числа У 2 взять Уз или 1^5 и т. д, 

Система чисел вида 

а-\-Ь у/~2 (2) 

с любыми рациональными (или лишь с любыми целыми) коэффи- 
циентами а, Ь не будет кольцом, так как произведение числа \/ 2 
на самого себя нельзя, как легко проверить, записать в виде (2) х ). 
Однако система чисел вида 

а + Ь 3 і/2+сІ/4 ( 3 ) 

с любыми рациональными коэффициентами а, Ь, с уже будет кольцом, 
и это же имеет место, если ограничиться случаем целых коэффи- 
циентов. 

г ) Действительно, пусть 

1/4=а + Ь 3 /2, (20 

где числа а и 6 рациональны. Умножая обе части этого равенства на |/^2, 
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Рассмотрим теперь все действительные числа, которые можно 
получить, применяя несколько раз операции сложения, умножения 
и вычитания к хорошо известному читателю числу я и каким-либо 
рациональным числам. Это будут числа, которые могут быть запи- 
саны в виде 

а о + а^к + а 2 л 2 + . . . + а п л п , (4) 

где а 0 , а 1( а 2 , ..., а п — рациональные числа, п^= 0. Заметим, что 
никакое число не может обладать двумя различными записями вида 
(4) — в противном случае, беря разность двух таких записей, мы 
получили бы, что число я удовлетворяет некоторому уравнению 
с рациональными коэффициентами; методами математического анализа 
доказывается, однако, что я не может удовлетворять на самом деле 
никакому уравнению с рациональными коэффициентами, т. е. является 
числом трансцендентным. Не используя, впрочем, этого результата, 
т. е. не предполагая, что запись числа в виде (4) однозначна, можно 
все же показать, что числа вида (4) составляют кольцо. 

Кольцом будет также совокупность чисел, получающихся из числа я 
и рациональных чисел при помощи операций сложения, умножения, 
вычитания и деления, примененных несколько раз. Для доказательства 
нет необходимости искать для рассматриваемых чисел какую-либо 
специальную хорошую запись (хотя она и может быть найдена); если 
числа аир получены из числа я и некоторых рациональных чисел 
указанными операциями, то это же верно, понятно, и для чисел 

а + р, а — Р, ар, а также (при Р Ф 0) для числа . 

Наконец, взяв совокупность комплексных чисел а -\-Ы с любыми 
рациональными а, Ъ, мы получим кольцо; это же будет иметь 
место, если мы ограничимся целыми коэффициентами а, Ь. 

Рассмотренные примеры не могут дать полного представления 
о том, сколь разнообразными бывают числовые кольца. Мы не будем 
пока, однако, продолжать наш список примеров и перейдем к рас- 
смотрению одного специального и очень важного типа числовых 


получим: 

2 = а /2 + 6 /4. 

Подставляя сюда выражение (2') для 4, мы после очевидных преобразо- 
ваний придем к равенству 

(о + 6 2 ) >/Т=2-а6. (2") 

Если а + 6 2 Ф 0, то 

2 — об 

оТь 5 ’ 

что невозможно, так как справа стоит рациональное число. Если жеа + 6 а = 0, 
то, ввиду (2"), и 2 — а6 = 0. Из этих двух равенств вытекает 6 3 = — 2, что 
снова невозможно ввиду рациональности числа Ь. 
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колец. Мы знаем, конечно, что в системах всех рациональных, 
всех действительных и всех комплексных чисел можно неограниченно 
выполнять деление (кроме деления на нуль), в то время как деление 
целых чисел выводит за пределы системы этих чисел. До сих пор 
мы не обращали серьезного внимания на это различие, в действи- 
тельности же оно очень существенно и приводит к следующему 
определению. 

Числовое кольцо называется числовым полем , если оно содержит 
частное любых двух своих чисел (делитель предполагается, конечно, 
отличным от нуля). Можно говорить, следовательно, о поле рацио- 
нальных чисел, поле действительных чисел, полекомплексных чисел, 
в то время как кольцо целых чисел полем не является. 

Некоторые из рассмотренных выше примеров числовых колец 
в действительности являются полями. Сначала заметим, что не суще- 
ствует числовых полей, отличных от поля рациональных чисел и 
целиком в нем содержащихся (систему, состоящую из одного нуля, 
мы не будем считать полем). Справедливо даже следующее более 
общее утверждение: 

Поле рациональных чисел содержится целиком во всяком 
числовом поле. 

Пусть, в самом деле, дано некоторое числовое поле, которое мы 
обозначим буквой Р. Если а — любое число поля Р, отличное от 
нуля, то Я содержит и частное от деления числа а на самого себя, 
т. е. число единицу. Складывая единицу с самой собою несколько 
раз, мы получим, что все натуральные числа содержатся в поле Я. 
С другой стороны, в поле Я должна содержаться разность а — а, 
т. е. число нуль, а поэтому к Я принадлежит и результат вычита- 
ния любого натурального числа из нуля, т. е. любое целое отри- 
цательное число. Наконец, в поле Я лежат и частные целых чисел, 
т. е. вообще все рациональные числа. 

В поле комплексных чисел содержится много различных полей, 
и поле рациональных чисел будет лишь наименьшим среди них. Так, 
рассмотренное выше кольцо чисел вида 

а + ф/2 (5) 

с любыми рациональными (а не только лишь с целыми) коэф- 
фициентами а , Ь будет полем. В самом деле рассмотрим частное 
двух чисел вида (5), а л г Ъ\ г 2 и с + й]/ 2, причем второе число 
считаем отличным от нуля; отлично от нуля, следовательно, и число 
с — а ]/ 2 , и потому 

а + Ь Ѵ2 _ { а + Ь /Т)(с-гі Ѵ~2) ас — 2М . Ьс — ай 
с+а V? “(с+гі УТ)(с-сі Ѵ2) г - 

Мы получили снова число вида (5), причем коэффициенты остают- 
ся рациональными. В этом примере число У 2 можно заменить. 
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понятно, квадратным корнем из любого рационального числа, из ко- 
торого в самом поле рациональных чисел не извлекается квадрат- 
ный корень. Так, поле составляют числа вида а-\-Ы с рациональ- 
ными а, Ь. 


§ 44. Кольцо 

В различных отделах математики, а также в применениях мате- 
матики к технике и естествознанию приходится весьма часто встре- 
чаться с положением, когда алгебраические операции производятся 
не над числами, а над объектами совсем иной природы. Большое 
число таких примеров можно найти в предшествующих главах 
книги — напомним умножение и сложение матриц, сложение векторов, 
операции над многочленами, операции над линейными преобразова- 
ниями. Общее определение алгебраической операции, которому удо- 
влетворяют операции сложения и умножения в числовых кольцах, 
а также операции в указанных примерах, состоит в следующем. 

Пусть дано некоторое множество М, состоящее или из чисел, 
или из объектов геометрической природы, вообще из некоторых 
вещей, которые мы будем называть элементами этого множества. 
Говорят, что в множестве М определена алгебраическая операция, 
если указан закон, по которому любой паре элементов а, Ь из этого 
множества однозначным образом ставится в ■ соответствие не- 
который третий элемент с, также принадлежащий к М. Эта операция 
может быть названа сложением, и тогда с будет называться суммой 
элементов а и Ь и обозначаться символом с — а + Ь; эта операция мо- 
жет быть названа умножением, т. е. с будет произведением элемен- 
тов а и Ь, е = аЬ\ возможно, наконец, что для операции, определен- 
ной в множестве М, будет введена новая терминология и символика. 

В каждом из числовых колец определены две независимые опе- 
рации — сложение и умножение. Что же касается вычитания и деления, 
то их нельзя считать новыми операциями, так как они являются 
обратными соответственно для сложения и для умножения, если мы 
примем следующее общее определение обратной операции. 

Пусть в множестве М определена алгебраическая операция, на- 
пример сложение. Говорят, что для этой операции существует 
обратная операция — вычитание, если для любой пары элемен- 
тов а, Ь из М существует в М такой элемент й, притом лишь един- 
ственный, который удовлетворяет равенству Ь-\-й—а . Элемен т й 
называется тогда разностью элементов а и Ь и обозначается сим- 
волом й—а — Ь. 

В числовых полях обратной операцией обладает, очевидно, как 
сложение, так и умножение (последнее, правда, ограниченно: дели- 
тель должен быть отличным от нуля). В числовых же кольцах, не 
являющихся полями (как, например, в кольце целых чисел), обрат- 
ной операцией обладает лишь сложение. 
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С другой стороны, в системе всех многочленов от неизвестного х, 
коэффициенты которых принадлежат к фиксированному числовому 
полю Р, также определены две операции — сложение и умножение, 
причем сложение обладает обратной операцией — вычитанием. 

И в числовых кольцах, и в системе многочленов операции сложе- 
ния и умножения обладают, как известно, следующими свойствами 
(а, Ь, с — произвольные числа из рассматриваемого числового кольца 
или произвольные многочлены из рассматриваемой системы): 

1. Сложение коммутативно: а-\-Ь=Ъ-\-а. 

И. Сложение ассоциативно: а -|- (Ь-\- с)= (а + Ь) + с. 

Ш. Умножение коммутативно: аЬ=Ьа. 

IV. Умножение ассоциативно: а (Ьс) = (аЬ) с. 

V. Сложение и умножение связаны законом дистрибутивности: 

(а + Ь) с — ас -ф Ьс. 


Мы уже подготовлены теперь к общему определению понятия 
кольца, одного из важнейших понятий алгебры. 

Множество Р называется кольцом , если в нем определены две 
операции — сложение и умножение, обе коммутативные и ассоциатив- 
ные, а также связанные законом дистрибутивности, причем сложение 
обладает обратной операцией— вычитанием. 

Таким образом, примерами колец являются числовые кольца и 
кольца многочленов от неизвестного х с коэффициентами из дан- 
ного числового поля или даже из данного числового кольца. Укажем 
еще один пример, хорошо выясняющий широту понятия кольца. 

Курс математического анализа начинается с определения функ- 
ции действительного переменного х. Рассмотрим совокупность функ« 
ц'ий, определенных для всех действительных значений х и принимаю- 
щих действительные значения, и следующим образом определим в этой 
совокупности алгебраические-операции: суммой двух функций /(х) 
и ^-(х) будет функция, значение которой при любом х=х 0 равно 
сумме значений заданных функций, т. е. равно /(х 0 ) -]-^-(х 0 ), п Р°~ 
изведением этих функций — функция, значение которой при всяком 
х = х 0 равно произведению /(х 0 )-$(х 0 ). Сумма и произведение 
существуют, очевидно, для любых двух функций из рассматриваемой 
совокупности. Справедливость свойств I — V проверяется без всяких 
затруднений — сложение и умножение функций сводятся к сложению 
и умножению их значений при всяком х, т. е. к операциям над 
действительными числами, для которых свойства I — V имеют место. 
Наконец, считая разностью функций /(х)и^(х) функцию, значение 
которой при любом х=*х 0 равно разности /(х 0 ) — §{х 0 ), мы придем 
к операции вычитания, обратной сложению. Этим доказано, что 
совокупность функций , определенных для всех действительных х, 
после введения в нее описанным выше способом операций сложе- 
ния и умножения превращается в кольцо. 



272 


ПОЛЯ И МНОГОЧЛЕНЫ 


[гл. 10 


Другие примеры колец функций можно получить, сохраняя данные 
выше определения операций над функциями, но рассматривая функции, 
определенные, например, лишь для положительных значений перемен- 
ного х, или функции, определенные для значений х из отрезка [0, 1]. 
Вообще кольцом будет система всех функций, имеющих некоторую 
данную область определения. Можно было бы получить также примеры 
колец, рассматривая не все функции, определенные в данной области, 
а лишь изучаемые в курсе математического анализа непрерывные 
функции. Можно было бы, с другой стороны, рассматривать ком- 
плексные функции комплексного переменного. Вообще, различных 
колец функций, как и различных числовых колец, чрезвычайно много. 

Переходим к установлению некоторых простейших свойств 
колец, непосредственно вытекающих изопределения кольца. Эти 
свойства для случая чисел вполне привычны, однако читателю, быть 
может, покажется иногда неожиданным, что они являются следствиями 
лишь условий I — V и существования однозначного вычитания. 

Сначала несколько замечаний о значении условий 1 — V. Роль 
законов коммутативности не требует пояснений. Значение законов 
ассоциативности состоит в следующем: в определении алгебраи- 
ческой операции говорится о сумме или произведении лишь двух 
элементов. Если же мы попытаемся определить, например, произве- 
дение трех элементов а, Ь, с, то встретимся с таким затруднением: 
произведения аи и ѵс , где Ьс—и, аЬ—ѵ, могут, вообще говоря, 
не совпадать, т. е. а (Ъс)*^(аЪ) с. Закон ассоциативности требует, 
чтобы эти произведения были равны одному и тому же элементу 
кольца: этот элемент естественно принять в качеству произведения аЬс, 
записываемого уже без всяких скобок. Больше того, закон ассоциа- 
тивности позволяет однозначным образом определить произведе- 
ние {соответственно , сумму) для любого конечного числа элемен- 
тов кольца , т. е. позволяет доказать независимость произведения 
любых п элементов от первоначального распределения скобок. 

Докажем это утверждение индукцией по числу п. Для п — 3 оно уже 
доказано, поэтому полагаем п > 3, причем считаем, что для всех чисел, мень- 
ших п, наше утверждение уже доказано. Пусть даны элементы а 1 , а 2 , ...,а п 
и пусть в этой системе некоторым образом распределены скобки, указывающие 
на порядок, в каком должно выполняться умножение. Последним шагом будет 
умножение произведения первых к элементов а г а 2 . . . а к (где — 1) 

иа произведение а к + 1 а к + 2 . . . а п . Так как эти произведения состоят из мень- 
шего, чем л, числа множителей и поэтому, по предположению, однозначно 
определены, то нам остается доказать для любых к и / равенство 

(йі «2 ■■■ а к ) ( а к+1 а к+2 ... а п ) = {а 1 а 2 ... а,) {а 1+Л а 1+2 ... а п ). 

Для этого достаточно рассмотреть случай / = /?-}- 1. В этом случае, однако, 
полагая 

а 1 а 2 ...й^ = о, аь+2 а к+з • • * а п — с > 

мы получаем на основания закона ассоциативности 

Ь{а к+1 с) = (Ьа к+1 )с, 

Этим наше утверждение доказано. 
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Можно говорить, в частности, о произведении п равных между 
собою элементов, т. е. ввести понятие о степени а п элемента а 
с целым положительным показателем п. Легко проверить, что все 
обычные правила оперирования с показателями остаются справедли- 
выми в любом кольце. Закон ассоциативности сложения приводит 
аналогичным образом к понятию о кратном па элемента а с целым 
положительным коэффициентом п. 

Закон дистрибутивности , т. е. обычное правило раскрытия 
скобок, является единственным требованием в определении кольца, 
связывающим сложение и умножение; лишь благодаря этому закону 
совместное изучение двух указанных операций дает больше, чем 
можно было бы получить при их раздельном изучении. В формули- 
ровке закона дистрибутивности участвует сумма лишь двух слагаемых. 
Без всякого труда доказывается, однако, справедливость равенства 

( а і 4~ а 2 4~ • • • 4* а ь) Ь= а^Ь а 2 Ь 4- ... 4* а к Ъ 

при любом А, а затем и общего правила умножения суммы на сумму. 

Во всяком кольце выполняется закон дистрибутивности и для 
разности. Действительно, по определению разности элемент а — Ь 
удовлетворяет равенству 

Ь-\- (а — Ь) — а. 

Умножая обе части этого равенства на с и применяя к левой части 
равенства закон дистрибутивности, мы получаем: 

Ьс (а — Ь) с — ас. 

Элемент (а — Ь) с является, следовательно, разностью элементов ас 
и Ьс: 

(а — Ь) с = ас — Ьс. 

Весьма важные свойства колец вытекают из существования вычи- 
тания. Если а есть произвольный элемент кольца /?, то разность 
а — а будет некоторым вполне определенным элементом кольца. 
Его роль аналогична роли нуля в числовых кольцах, однако по 
определению он может зависеть от выбора элемента а , и поэтому 
мы обозначим его пока через 0 а . 

Докажем, что на самом деле элементы 0 Й для всех а равны между 
собой. Действительно, если Ь есть произвольный другой элемент 
кольца 7?, то, прибавляя к обеим частям равенства 

а 4“ ( Ь — а ) - Ь 

элемент 0 а и используя равенство 0 б 4 -а = а, мы получаем: 

0 в + Ь=0 а 4~ а 4 - (Ь — а) = а 4 - (Ь — а) = Ь. 


Таким образом, 0 а = Ь — Ь— 0 Ь . 
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Мы доказали, что всякое кольцо 7? обладает однозначно опре- 
деленным элементом, сумма которого с любым элементом а 
этого кольца равна а. Будем называть этот элемент нулем кольца /? 
и обозначать символом 0, не считая серьезной опасность смешать 
его с числом нуль. Таким образом, 

а-}- 0 — а для всех а из /?. 

Далее, во всяком кольце для любого элемента а существует 
однозначно определенный противоположный элемент — а, удовле- 
творяющий равенству 

д + ( — д) = 0, 

а именно, этим элементом будет разность 0 — а; однозначность 
вытекает из однозначности вычитания. Очезидно, что — ( — д) = д. 
Разность Ь — а двух любых элементов кольца можно записать те- 
перь в виде 

Ь — а—Ь-\- ( — а). 

Действительно, 

\Ь ( — д)] 4- д= Ь -р [( — а) д] = Ь 0 = Ь. 

Для любого элемента а кольца и любого целого положитель- 
ного числа п имеет место равенство 

п( — а) = — (па). 

Действительно, группировкой слагаемых получаем: 

па 4- п ( — а) = п [а + ( — д)] = п • 0 = 0. 

Мы получили теперь возможность определить отрицательные 
кратные элемента кольца: если л>0 то равные между собой эле- 
менты п ( — д) и — (па) будут обозначаться через ( — п) а. Условимся, 
наконец, нулевым кратным 0 -а любого элемента а считать нуль 
рассматриваемого кольца. 

Определение нуля дано нами лишь при помощи операции сложе- 
ния и ей обратной, т. е. без использования умножения. В случае 
чисел, однако, число нуль и по отношению к умножению обладает 
одним характерным и притом очень важным свойством. Оказывается, 
что этим свойством обладает нуль любого кольца: во всяком кольце 
произведение любого элемента на нуль равно нулю. Доказательство 
непосредственно опирается на закон дистрибутивности: если а есть 
произвольный элемент кольца /?, то, каков бы ни был вспомога- 
тельный элемент х этого кольца, мы получим: 

а-0 — а(х — х) = ах — ах = 0. 

Пользуясь этим свойством нуля, можно доказать, что во всяком 
кольце для любых элементов а, Ь справедливо равенство 

( — а)Ь= — аЬ. 
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Действительно, 

аЬ 4- ( — а) Ь— [а + ( — а)] Ь—О-Ь = 0. 

Отсюда следует, что хорошо известное и все же несколько таин- 
ственное правило умножения отрицательных чисел — «минус на минус 
дает плюс» — также вытекает из определения кольца, т. е. в лю- 
бом кольце имеет место равенство 

( — а) ( — Ь) = аЬ. 

В самом деле, 

{ — а){—Ь) = —[а{—Ъ)] = —{ — аЪ) = аЪ. 

Читатель без труда докажет теперь, что во всяком кольце для 
кратных (в том числе и отрицательных) любого элемента остаются 
справедливыми все правила оперирования с кратными некоторого 
числа. 

Таким образом, алгебраические операции в произвольном кольце 
обладают многими привычными нам свойствами операций над числами. 
Не следует думать, однако, что любое свойство сложения и умно- 
жения чисел сохраняется во всяком кольце. Так, умножение чисел 
обладает свойством, обратным рассмотренному выше: если про- 
изведение двух чисел равно нулю, то хотя бы один 
из множителей равен нулю. Это свойство уже не может 
быть распространено на любые кольца — в некоторых кольцах можно 
указать такие пары отличных от нуля элементов, произведение 
которых равно нулю, т. е. аф 0, Ьф 0, но аЬ— 0; элементы а, Ь 
с этим свойством называются делителями нуля. 

Примеров колец с делителями нуля нельзя найти, понятно, среди 
числовых колец. Не содержат делителей нуля и кольца многочленов 
с числовыми коэффициентами. Многие кольца функций обладают, 
однако, делителями нуля. Заметим, прежде всего, что нулем во 
всяком кольце функций будет функция, равная нулю при всех зна- 
чениях переменного х. Построим теперь следующие функции /( х ) 
и ^(х), определенные для всех действительных значений х: 

/(х) = 0 при х=^0, /(х) = х при х>0; 

^(х) = х при х 0, §’(х) = 0 при х>0. 

Обе эти функции отличны от нуля, так как не при всех значениях х 
равны нулю их значения; произведение же этих функций равно нулю. 

Не все требования I — V, входящие в определение кольца, являются в оди- 
наковой мере необходимыми. Развитие науки показывает, что в то время 
как свойства вложения I и II и закон дистрибутивности V имеют место 
во всех приложениях, включение в определение кольца свойств умножения 
III и IV часто оказывается излишне стеснительным, суживая возможную 
область применимости этого понятия. Так, множество квадратных матриц 
порядка л с действительными элементами, рассматриваемое с операциями 
сложения и умножения матриц, удовлетворяет всем требованиям, входящим 
в определение кольца, за исключением закона коммутативности умножения. 
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С некоммутативными умножениями приходится встречаться так часто и 
в таких важных случаях, что в настоящее время под термином «кольцо» 
понимают обычно некоммутативное кольцо (точнее, не обязательно комму- 
тативное кольцо, в смысле возможной некоммутативности умножения), на- 
зывая тот частный тип колец, в которых требование III выполняется, ком- 
мутативными кольцами. 

В последнее время повышается интерес и к кольцам с неассоциативным 
умножением и общая теория колец уже строится сейчас как теория неассо- 
циативных (т. е. необязательно ассоциативных) колец. Простейшим примером 
таких колец является множество векторов трехмерного евклидова простран- 
ства относительно операций сложения и (известного из курса аналитической 
геометрии) векторного умножения векторов. 

§ 45. Поле 

Подобно тому как среди числовых колец были выделены и на- 
званы числовыми полями те кольца, в которых можно выполнять 
деление (кроме деления на нуль), естественно сделать это и в об- 
щем случае. Заметим сначала, что ни в каком \ кольце невозможно 
деление на нуль ввиду доказанного выше свойства нуля по отно- 
шению к умножению: разделить элемент а на нуль означает найти 
в кольце такой элемент х, что 0-х— а, что при афО невозможно, 
так как левая часть равна нулю. 

Введем следующее определение: 

Кольцо ^называется полем, если оно состоит не только из одного 
нуля и если в нем деление выполнимо, притом однозначным образом, 
во всех случаях, кроме случая деления на нуль, т. е. если для 
любых элементов а и Ь т Р, из которых Ь отлично от 
нуля, существует в Р такой элемент < 7 , притом лишь единствен- 
ный, который удовлетворяет равенству Ь^=а. Элемент <7 назы- 
вается частным элементов а и Ь и обозначается символом ^ — 

Примерами полей служат, понятно, все числовые поля. Кольцо 
многочленов от неизвестного х с действительными коэффициентами 
или вообще с коэффициентами из некоторого числового поля не 
является полем — существующее для многочленов деление с остатком 
отличается, конечно, от деления «нацело», предполагающегося в опре- 
делении поля. С другой стороны, легко видеть, что совокупность 
всех дробно-рациональных функций с действительными коэффи- 
циентами (см. § 25) будет полем, содержащим кольцо многочле- 
нов, подобно тому как поле рациональных чисел содержит кольцо 
целых чисел. 

Среди колец функций можно указать некоторые другие примеры 
полей; мы не будем, однако, на них останавливаться и перейдем 
к примерам совсем иного рода. 


*) Единственность деления в поле, как и предполагавшаяся в определе- 
нии кольца единственность вычитания, в действительности без труда могут 
быть доказаны при помощи других требований, входящих в определение 
поля или, соответственно, кольца. 
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Все числовые кольца и вообще кольца, которые мы до сих пор 
рассматривали, содержат бесконечно много элементов. Существуют, 
однако, кольца и даже поля, состоящие лишь из конечного числа 
элементов. Простейшие примеры конечных колец и конечных полей , 
существенно используемые в особой ветви математики — теории 
чисел, строятся следующим образом. 

Берем любое натуральное число п, отличное от 1. Целые числа а 
и Ь называются сравнимыми по модулю п, 

а=Ь (той л), 


если эти числа дают при делении на п один и тот же остаток, 
т. е. если их разность нацело делится на п. Все кольцо целых 
чисел распадается на п непересекающихся классов, 

^о> С ѵ . . . , С п _ 1> (1) 

сравнимых между собой по модулю п чисел, причем класс С к , 
к = 0, 1 , .... п — 1 , состоит из чисел, дающих при делении на п 
в остатке к. Оказывается, что можно вполне естественным спосо- 
бом определить сложение и умножение этих классов. 

Возьмем с этой целью любые (притом не обязательно различные) 
классы С к и С ь из системы (1). Складывая любое число из класса С к 
с любым числом из класса С„ мы будем получать числа, лежащие 
в одном вполне определенном классе, а именно в классе С к+1 , если 
&-)-/<; л, или в классе С к+1 _ п , если к + І^п. Это приводит 
к такому определению сложения классов : 

С к ~\-С 1 — С к+1 при й-}-/<7л, 
с к+ с с= с к+і- п при к + І^п. 

С другой стороны, умножая любое число класса С к на любое число 
класса С р мы будем получать числа, снова лежащие во вполне 
определенном классе, а именно в классе С п где г — остаток при 
делении произведения кі на п. Мы принимаем поэтому такое опре- 
деление умножения классов : 

С к -С 1 = С г , где кІ=пд + г, 0^г<п. (3) 

Система (1) классов целых чисел, сравнимых между собой 
по модулю я, будет кольцом по отношению к операциям, опре- 
деленным условиями (2) и (3). В самом деле, справедливость тре- 
бований I — V из определения кольца без труда устанавливается не- 
посредственной проверкой, но вытекает также из справедливости 
этих требований в кольце целых чисел и той связи между опера- 
циями над целыми числами и операциями над классами, которая 
указана выше. Роль нуля играет, очевидно, класс С 0 , состоящий из 
чисел, нацело делящихся на п. Противоположным для класса С к , 
к= 1, 2, ...,п — 1, будет класс С п _ к . В системе классов (1) можно 
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определить, следовательно, вычитание, т. е. эта система удовлет- 
воряет всем требованиям, входящим в определение кольца. Условимся 
обозначать полученное кольцо через 7, п . 

Если, число п составное, то кольцо 2. п обладает делителями 
нуля и поэтому, как будет показано ниже, не может быть полем. 
В самом деле, если п — Ы , где 1<7б<л, 1-</<л, то классы С к 
и С с отличны от нулевого класса С 0 , но на основании определения 
умножения классов (см. (3)) С (г -С [ =С 0 . 

Если же число п простое, то кольцо Е п будет полем. 

В самом деле, пусть даны классы С к и С т , причем С к фС 0 , 
т. е. 1 её к^п — 1. Нужно показать, что можно разделить С т на С к , 
т. е. найти такой класс С { , что С к -С 1 — С т . Если С т = С 0 , то и 
С і = С 0 . Если же С т -фС й , то рассмотрим систему чисел 

к, 2 к, 3 к, .... (л — \)к. (4) 

Все эти числа лежат вне нулевого класса С 0 , так как произведение 
двух натуральных чисел, меньших простого числа л, не может на л 
делиться. Далее, никакие два числа эк и ік из системы (4), з<б.і, 
не могут лежать в одном классе, так как тогда их разность 

ік — $к = {і — 5) к 

делилась бы на л, что сноза противоречит простоте числа л. Таким 
образом, в каждом ненулевом классе лежит ровно одно число из 
системы (4). В частности, в классе С т лежит число Ік, где 
— 1, т. е. С [ -С к = С т , а тогда класс С { и будет искомым 
частным от деления С т на С к . 

Мы получили, таким образом, бесконечно много различных ко- 
нечных полей: поле Д 2 , состоящее всего из двух элементов, а также 
поля Д 3 , Д 5 , Д 7 , 2 г1 и т. д. 

Переходим к рассмотрению некоторых свойств полей, 
вытекающих из существования деления. Эти свойства аналогичны 
свойствам колец, основанным на существовании вычитания, и дока- 
зываются такими же рассуждениями, поэтому проведение доказа- 
тельств предоставляется читателю. 

Всякое поле Р обладает однозначно определенным элементом, 
произведение которого на любой элемент а этого поля равно а. 

Этот элемент, совпадающий с равными между собою частными ~ 

для всех а, отличных от нуля, называется единицей поля Р и обо- 
значается символом 1. Таким образом, 

а-1=а для всех а из Р. 

Во всяком поле для любого элемента а, отличного от нуля, 
существует однозначно определенный обратный элемент а -1 , 
удовлетворяющий равенству 

а-а ~ 1 = 1 , 
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1 ь 

а именно, а -1 = — . Очевидно, что (а -1 ) -1 = а. Частное — можно 
а ' ' а 

записать теперь в виде 



Для любого элемента а, отличного от нуля, и любого целого 
положительного числа п имеет место равенство 

Обозначая эти равные между собою элементы через а~ п , мы при- 
ходим к отрицательным степеням элемента поля, для которых 
сохраняются обычные правила оперирования. Положим, наконец, 
а 0 — 1 для всех а. 

Существование единицы не является характерным свойством по- 
лей: единицей обладает, например, кольцо целых чисел. Вместе с тем, 
пример кольца четных чисел показывает, что не все кольца обладают 
единицей. С другой стороны, всякое кольцо, обладающее единицей 
и содержащее обратный элемент для любого элемента , отлич- 
ного от нуля , будет полем. Действительно, в этом случае част- 
ным , а ФО, будет служить произведение Ьа~ 1 . Единственность 

этого частного доказывается без затруднений. 

Заметим, что никакое поле не содержит делителей нуля. Дей- 
ствительно, пусть аЬ~ 0, но аф 0. Умножая обе части равенства на 
элемент а -1 , мы получим слева (а~ 1 а)Ь— 1 -Ь=Ь, а справа 
а -1 . 0 = 0, т. е. й = 0. Отсюда следует, что во всяком поле лю- 
бое равенство можно сократить на общий множитель, отличный 
от нуля. В самом деле, если ас — Ьс и сфО, то ( а — Ь)с= 0, 
откуда а — Ь = 0, т. е. а — Ь. 

Из определения частного ~ (где Ьф 0) и доказанной выше воз- 
можности записывать его в виде произведения аЬ~ г без труда может 
быть выведено, что во всяком поле сохраняются все обычные пра- 
вила обращения с дробями, а именно: 

ас . , 

-г = -7 тогда и только тогда, если аа = ос\ 
о а 

а , с ай ± Ьс ' 

Т> Ы ’ 

а с ас _ 

~Ь ’Ч ~М’ 

— а а 

Характеристика поли. Не все свойства числовых полей со- 
храняются в случае произвольного поля. Так, складывая число 1 
само с собою несколько раз, т. е. беря любое целое положительное 
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кратное единицы, мы никогда не получим нуля, и вообще все эти крат- 
ные, т. е. все натуральные числа, отличны друг от друга. Если же 
мы будем брать целые кратные единицы в каком-либо конечном 
поле, то среди них непременно будут равные, так как это поле обла- 
дает лишь конечным числом различных элементов. Если все целые 
кратные единицы поля Р являются различными элементами поля Р, 
т. е. кЛфІЛ при кфі, то говорят, что поле Р имеет характе- 
ристику нуль ; таковы, например, все числовые поля. Если же су- 
ществуют такие целые числа к а I, что &>/, но в Р имеет место 
равенство А - 1 = /* 1 , то (к — /) - 1 = 0, т. е. в Р существует такое 
положительное кратное единицы, которое оказывается равным нулю. 
В этом случае Р называется полем конечной характеристики , 
а именно характеристики р, если р есть тот первый положитель- 
ный коэффициент, с которым единица поля Р обращается в нуль. 
Примерами полей конечной характеристики служат все конечные 
поля; существуют, впрочем, и бесконечные поля, имеющие конечную 
характеристику. 

Если поле Р имеет характеристику р, то число р будет 
простым. 

Действительно, из равенства р — аі , где $<.р, і <.р, вытекало 
бы равенство ($• 1) (і- 1) —р - 1 = 0, т. е., так как в поле не может 
быть делителей нуля, или 5.1=0, или ^ - 1 = 0, что, однако, про- 
тиворечит определению характеристики как наименьшего поло- 
жительного коэффициента, обращающего единицу поля в нуль. 

Если характеристика поля Р равна р, то для любого эле- 
мента а из этого поля имеет место равенство ра—0. Если же 
характеристика поля Р равна 0 и а — элемент этого поля, 
п — целое число, то из а Ф0 и п ф 0 следует па Ф 0. 

Действительно, в первом случае элемент ра, т. е. сумму р сла- 
гаемых, равных а, можно, вынося а за скобки, представить в виде 

ра = а (р- 1) = а-0 — 0. 


Во втором случае из равенства па~ 0, т, е. а(л-1) = 0, следо- 
вало бы при аф 0 равенство л* 1=0, т. е,, так как характери- 
стика поля равна нулю, я = 0. 

Подполя, расширения. Пусть в поле Р некоторая часть его эле- 
ментов, составляющая множество Р ' , сама оказывается полем по 
отношению к тем операциям, которые определены в поле Р, т. е. 
для любых двух элементов а, Ь из Р' содержащиеся в поле Р эле- 
менты а-\-Ь, аЬ, а — Ь и, при Ьф 0, у принадлежат к Р' (за- 
коны 1 — V, выполняясь в Р, будут, конечно, выполняться и в Р'). 
Тогда Р' называется подполем поля Р, а Р — расширением поля Р\ 
Понятно, что нуль и единица поля Р будут содержаться также в Р' 
и служить для Р' нулем и единицей. Так, поле рациональных чисел 
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является подполем поля действительных чисел; все числовые поля 
будут подполями поля комплексных чисел. 

Пусть в поле Р даны подполе Р' и элемент с, лежащий вне Р', 
и пусть мы нашли минимальное подполе Р" поля Р, содержащее и 
Р' , и с. Такое минимальное подполе может быть только одно, так 
как если бы Р'" было еще одно подполе с этими свойствами, то пе- 
ресечение подполей Р" и Р'" (т. е. совокупность элементов, общих 
обоим подполям) содержало бы Р' и элемент с и вместе с любыми 
двумя своими элементами содержало бы их сумму (эта сумма должна 
содержаться и в Р", и в Р"\ а потому и в их пересечении), а также 
их произведение, разность и частное; иными словами, это пересече- 
ние само было бы подполем, в противоречие с минимальностью под- 
поля Р". Мы будем говорить, что поле Р" получено присоедине- 
нием к полю Р' элемента с , и употреблять запись Р" = Р' (с). 

Понятно, что поле Р' (с) содержит, помимо элемента с и всех 
элементов поля Р\ также все элементы, которые получаются из них 
при помощи сложения, умножения, вычитания и деления. В качестве 
примера укажем на рассматривавшееся в § 43 расширение поля ра- 
циональных чисел, состоящее из чисел вида а-\-Ь У 2 с рациональ- 
ными а, Ь: это расширение получается присоединением к полю ра- 
циональных чисел числа У~2. 

§ 46*. Изоморфизм колец (полей). Единственность поля 
комплексных чисел 

В теории колец большую роль играет понятие изоморфизма. 
Именно, кольца і и Г называются изоморфными, если между ними 
можно установить такое взаимно однозначное соответствие, при ко- 
тором для любых элементов а, Ь из I. и соответствующих им эле- 
ментов а', Ь' из А' сумме а -\-Ь соответствует сумма а' -\-Ь', а 
произведению аЬ соответствует произведение а'Ь' . 

Пусть между кольцами і и і' установлено изоморфное соответ- 
ствие. При этом соответствии нулю 0 кольца А соответствует 
нуль 0' кольца И . Действительно, пусть элементу 0 соответствует 
элемент с' из Берем произвольный элемент а из I* и соответ- 
ствующий ему элемент а' из V . Тогда элементу а-)- 0 должен соот- 
ветствовать элемент а' + с'; но а-{-0 = а, поэтому а'-\-с' — а', 
откуда с' = 0'. Далее, элементу — а соответствует элемент 
— а'. Действительно, пусть элементу — а соответствует элемент й' . 
Тогда элементу а-4-{ — а) = 0 должен соответствовать элемент 
а' -)- Л ' , т. е. а' + й' =0', откуда й' = — а'. Отсюда следует, что раз- 
ности элементов из і соответствует разность соответствую- 
щих элементов в V . Аналогичными рассуждениями можно показать, 
что если кольцо А обладает единицей, то образ этого элемента 
(т, е. элемент, соответствующий ему в V при рассматриваемом 
изоморфизме) будет единицей кольца V , и если элемент а из А 
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обладает обратным элементом а -1 , то образом элемента а -1 в V 
будет элемент, обратный к а . 

Отсюда следует, что кольцо , изоморфное полю, само будет 
полем. Легко видеть также, что свойство кольца не иметь делите- 
лей нуля также сохраняется при изоморфном соответствии. Вообще, 
изоморфные кольца могут отличаться друг от друга природой своих 
элементов, но они тождественны по своим алгебраическим свой- 
ствам; всякая теорема, доказанная относительно некоторого кольца, 
будет справедливой для всех колец, с ним изоморфных, если только 
в доказательстве теоремы использовались лишь свойства операций, 
а не индивидуальные свойства элементов этого кольца. По этой при- 
чине мы не будем считать изоморфные кольца или поля различ- 
ными г, они будут для нас лишь разными экземплярами одного и 
того же кольца или поля. 

Применим это понятие к вопросу о построении поля комплекс- 
ных чисел. Изложенная в § 17 конструкция поля комплексных чисел, 
основанная на использовании точек плоскости, не является един- 
ственно возможной. Вместо точек можно было бы взять отрезки (век- 
торы) на плоскости, выходящие из начала координат, и, задавая эти 
векторы их компонентами а, Ь на осях координат, определить сло- 
жение и умножение векторов при помощи тех же самых формул (2) 
и (3) из § 17, как и в случае точек плоскости. Можно было бы, 
далее, вообще отказаться от привлечения геометрического материала; 
замечая, что и точки плоскости, и векторы на плоскости задаются 
упорядоченными парами действительных чисел (а, Ь), можно просто 
взять совокупность всех таких пар и в ней ввести сложение и умно- 
жение по формулам (2) и (3) из указанного параграфа. 

На самом деле все эти поля оказались бы по своим алгебраиче- 
ским свойствам неразличимыми, как показывает следующая теорема: 

Все расширения поля действительных чисел О, полученные 
присоединением к полю О корня уравнения 

* 2 +1=0, (1) 

изоморфны между собой. 

Пусть, в самом деле, дано какое-либо поле Р, являющееся рас- 
ширением поля О и содержащее элемент, удовлетворяющий уравне- 
нию (1). Выбор обозначения для этого элемента находится в нашем 
распоряжении, и мы употребим для этой цели букву і. Таким обра- 
зом, имеет место равенство і 2 -)-1=0 (откуда і 2 = — ■ 1), где воз- 
ведение в степень и сложение нужно понимать в смысле операций, 
определенных в поле Р. Мы хотим найти сейчас поле 0(1), полу- 
чающееся присоединением к полю Р элемента і, т. е. найти мини- 
мальное подполе поля Р , содержащее и поле О, и элемент і. 

Рассмотрим для этой цели все те элементы а поля Р, которые 
можно записать в виде 

а = а + Ы, (2) 
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где а и Ь — произвольные действительные числа, а произведение 
числа Ь на элемент і и сумму числа а с этим произведением следует 
понимать в смысле операций, определенных в поле Я. Никакой эле- 
мент а поля Яне может обладать двумя различными записями такого 
вида: из 

а — а Ы — а + Ы 

и Ь Ф Ь следовало бы 


і — 


а — а 

Ь— V 


т. е. і оказалось бы действительным числом; если же Ь = Ь, то и 
а = а. К числу элементов поля Я, записываемых в виде (2), при- 
надлежат, в частности, все действительные числа (случай Ь — 0), а 
также сам элемент і (случай а = 0, 6=1). 

Покажем, что совокупность всех элементов вида (2) составляет 
подполе поля Я; это и будет тогда искомым полем В(і). Пусть нам 
даны элементы а—а-\~Ы и р = с + й?і. Тогда, используя коммута- 
тивность и ассоциативность сложения и закон дистрибутивности, 
имеющие место в поле Я, получаем: 

а4- Р = {а 4~ Ы) — (с — |— йі ) — [а -|- с) -{- (Ы 4- йі) ) 

откуда 

а + Р = ( а + с ) + (^+ й) *\ (3) 

т. е. эта сумма снова принадлежит к рассматриваемому множеству 
элементов. Далее, 

-р = (-с) + (-^)і, 

так как, ввиду (3), тогда будет справедливо равенство р 4- ( — Р) = 
=0-|-0/ = 0; поэтому 

а — Р — а + ( — Р) = (о — с) + (Ь — й) і, (3') 

т. е. и вычитание не выводит нас за пределы рассматриваемого мно- 
жества. Снова используя свойства I — V, имеющие место для опера- 
ций в поле Я (см. § 44), и опираясь на равенство і г — — 1 , мы 
получаем: 

сф = (с + Ы) (с + йі) = ас 4- айі -\- Ьсі 4- ЬйР, 

т. е. 

оф = {ас — Ьй) -г {ай + Ьс) г; (4) 

таким образом, произведение двух любых элементов вида (2) снова 
будет элементом этого же вида. Предположим, наконец, что р Ф 0, 
т. е. хотя бы одно из чисел с, й отлично от нуля. Тогда будет 
также с — йі ф 0 и 

(с 4- йі) (с — йі) = с 2 — {йі) г = с 2 — сРР = с 2 4- й 2 , 
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причем с г -\-й 2 Ф 0. Поэтому, используя отмечавшееся в предше- 
ствующем параграфе утверждение, что во всяком поле сохраняются 
все обычные правила обращения с дробями, а поэтому, в частности, 
дробь не меняется от умножения ее числителя и знаменателя на один 
и тот же отличный от нуля элемент, получаем: 

а а + Ы _ (а + Ы) (с — йі) __ (ас + Ьгі) + (Ьс — асі) і 
р — с + <іі~ (с -(-<&) (с — ііі) с 2 + <Р ’ 

т. е. элемент 

а_ ас+М . Ьс — ад . /і( ,, 

■р ~ с 2 + й 2 ' 1_ с 2 + й 2 1 ' 

снова имеет вид (2). 

Покажем теперь, что полученное нами подполе И (і) поля Р 
изоморфно тому полю из точек плоскости, которое было по- 
строено в § 17. Сопоставляя элементу а-\-Ы поля О (і) точку (а, Ь), 
мы получим ввиду доказанной единственностіі записи вида (2) для 
элементов поля ^(г) взаимно однозначное соответствие между эле- 
ментами этого поля и всеми точками плоскости. При этом соответ- 
ствии действительному числу а соответствует точка (а, 0) ввиду ра- 
венства а — а + 0і, а элементу г = 0 -+- 1 • / сопоставляется точка (0, 1). 
С другой стороны, сравнивая формулы (3) и (4) настоящего параграфа 
с формулами (2) и (3) из § 17, мы получаем, что сумме и произ- 
ведению элементов аир поля И (і) сопоставляются точки, являю- 
щиеся суммой и соответственно произведением точек, сопоставлен- 
ных элементам аир. 

Этим, так как все поля, изоморфные некоторому данному полю, 
изоморфны между собой, заканчивается доказательство теоремы. Мы 
видим, в частности, что выбор в § 17 формул (2) и (3) для определе- 
ния операций над точками не был случайным и не может быть из- 
менен. 

Помимо способов построения поля комплексных чисел, рассматривав- 
шихся выше, существуют и многие другие. Укажем один из них, использую- 
щий сложение и умножение матриц. 

Рассмотрим некоммутативное кольцо матриц второго порядка над полем 
действительных чисел. Очевидно, что скалярные матрицы 

а 0 
0 а 

составляют в этом кольце подполе, изоморфное полю действительных чисел. 
Оказывается, однако, что в кольце матриц второго порядка над полем 
действительных чисел можно найти также подполе, изоморфное полю 
комплексных чисел. В самом деле, поставим в соответствие всякому ком- 
плексному числу а + Ы матрицу 
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Этим путем все поле комплексных чисел отображается, притом взаимно 
однозначно, на часть кольца матриц второго порядка, причем из равенств 

( о. Ь\ / с й\_( а + с 6+гі\ 

V— Ь Л с) V— (6 + ф а+с)’ 

( а Ь\ / с й\__/ ас — М ад + Ьс\ 

\ — Ь а) у — й С У ~\ — ( аЛ + Ьс ) ас — Ьй) 

вытекает, что это отображение изоморфное, так как матрицы, стоящие 
в правых частях равенств, соответствуют комплексным числам (а+с) + 
+ (Ь+<1) і = (а + Ы) + (с + сП) и (ас—Ьй) -\-(а<1-\-Ьс)і~(а-\-Ы) (с + <#). В част- 
ности, роль мнимой единицы і играет матрица 

(-? !)■ 

Полученный нами результат указывает на еще один возможный способ 
построения поля комплексных чисел, столь же удовлетворительный, как и 
те, которые рассматривались выше. 

§ 47. Линейная алгебра и алгебра многочленов 
над произвольным полем 

В тех из предшествующих глав книги, которые посвящены л и- 
нейной алгебре, роль основного поля играло обычно поле дей- 
ствительных чисел. Без труда проверяется, однако, что очень мно- 
гое из этих глав дословно переносится на случай произвольного 
основного поля. 

Так, для произвольного основного поля Р остаются справед- 
ливыми изложенные в гл. 1 метод Г аусса для решения систем 
линейных уравнений, теория определителей и правило Крамера. 
Лишь замечание о кососимметрических определителях, приведенное 
в конце § 4, требует предположения, что характеристика поля Р 
отлична от двух. Впрочем, доказательство свойства 4 из 
этого же параграфа также теряет силу, если характеристика поля Р 
равна двум, хотя само это свойство остается справедливым. 

Полезно отметить также, что неоднократно высказывавшееся 
в гл. 1 утверждение о существовании у неопределенной системы 
линейных уравнений бесконечного множества различных решений 
сохраняет силу в случае любого бесконечного основного поля Р, 
но перестает быть справедливым, если поле Р конечно. 

Далее, полностью переносятся на случай произвольного основ- 
ного поля изложенные в гл. 2 теория линейной зависимости 
векторов, теория ранга матрицы и общая теория систем ли- 
нейных уравнений, а также алгебра матриц из гл. 3. 

Общая теория квадратичных форм, построенная в § 26, перено- 
сится на случай любого основного поля Р, характеристика кото- 
рого отлична от двух. Без этого ограничения, как легко показать, 
основная теорема этого параграфа уже перестает быть справедливой. 
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Пусть, например, Р = 2 2 ,т. е. является полем, состоящим из двух эле- 
ментов 0 и 1, причем 1-[-1=0, откуда — 1 = 1, и пусть над этим полем 
дана квадратичная форма [=х 1 х 2 . Если существует линейное преобра- 
зование 

х і — ^иИі + Ь 12 у 2 , 

Х і — Ъ'пУі + Ъ-22Уі’ 

приводящее / к каноническому виду, то в равенстве 

I — {ЬцУі + Ь 12 у г ) (Ь 21 у г Ь 22 у 2 ) = Ь п Ь 21 у* 4 - (ЬцЬ 22 4 - Ь 12 Ь 21 ) у 2 у 2 4 - Ь і2 Ь 22 у * 

коэффициент Ьі г Ь м + Ь і2 Ь 21 при произведении ууу 2 должен быть равен нулю. 
Этот коэффициент равен, однако, определителю взятого нами линейного 
преобразования, так как будет ли 6 12 Ь 21 =1 или же Ь 12 6 21 = 0, — в обоих 
случаях Ь 12 Ь 21 = — Ь 12 Ь 21 . Наше линейное преобразование оказалось выро- 
жденным. 

Дальнейшее содержание гл. 6 существенно относится к квадратич- 
ным формам с комплексными или действительными коэффициентами. 

Наконец, для случая произвольного основного поля Р сохра- 
няется вся построенная в гл. 7 теория линейных пространств 
и их линейных преобразований. Впрочем, понятие характеристиче- 
ского корня связано с теорией многочленов над произвольным полем, 
о которой речь будет идти ниже. Заметим, что теорема из § 33 
о связи между характеристическими корнями и собственными значе- 
ниями примет теперь следующую формулировку: характеристические 
корни линейного преобразования ф, лежащие в основном поле Р, и 
только они, служат собственными значениями этого преобразования. 

Что же касается теории евклидовых пространств (гл. 8), то она 
существенно связана с полем действительных чисел. 

На случай произвольного основного поля Р могут быть перене- 
сены и некоторые из изложенных выше разделов алгебры мно- 
гочленов. Предварительно необходимо, однако, придать точный 
смысл понятию многочлена над произвольным полем. 

Дело в том, что в § 20 указывались две точки зрения на поня- 
тие многочлена — формально-алгебраическая и теоретико-функцио- 
нальная. Они обе могут быть перенесены на случай произвольного 
основного поля. Будучи, однако, равносильными для случая числовых 
полей (см. § 24) и, как легко проверить, для бесконечных полей 
вообще, для конечных полей они уже перестают быть равно- 
сильными. 

Рассмотрим, например, введенное в § 45 поле 2 2 , состоящее из 
двух элементов 0 и 1, причем 1 + 1=0. Многочлены дг+1 и 
щ 2 +1 с коэффициентами из этого поля являются различными, т. е. 
не удовлетворяют алгебраическому определению равенства много- 
членов. Вместе с тем, оба эти многочлена при х — 0 получают зна- 
чение 1, а при щ=1 — значение 0, т. е. как «функции» от «пере- 
менного» х, принимающего значения в поле ІГ 2 , они должны считаться 
равными. В поле 2+ состоящем из трех элементов: 0, 1, 2, причем 
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1-]~2 = 0, в таком же положении находятся многочлены д; 3 -(- х -\- 1 
и 2х-\-\. Такие примеры можно указать вообще для всех конеч- 
ных полей. 

Таким образом, в теории, относящейся к случаю произвольного 
поля Р, невозможно принять теоретико-функциональную точку зре- 
ния на многочлены. Необходимо, следовательно, придать полную 
ясность формально-алгебраическому определению многочлена. С этой 
целью мы проведем такое построение кольца многочле- 
нов над произвольным полем Р, которое не использует 
с самого начала обычной записи многочленов через «неизвестное» х. 

Рассмотрим всевозможные упорядоченные конечные системы эле- 
ментов поля Р, имеющие вид 

(яо, а 1 а п _ ъ а п ), (I) 

причем п произвольно, п 5= 0, но при я>0 должно быть а п Ф 0. 
Определяя для систем вида(1) сложение и умножение в соответствии 
с формулами (3) и (4) § 20, мы превратим совокупность этих 
систем в коммутативное кольцо; доказательства необходимых для 
этого свойств дословно повторяют то, ■что делалось в § 20 для 
числовых многочленов. 

В построенном нами кольце системы вида (а) (случай п— 0) 
составляют подполе, изоморфное полю Р. Это позволяет отожде- 
ствить такие системы с соответствующими элементами а поля Р, т. е. 
положить 

(а) = а для всех а из Р. (2) 

С другой стороны, обозначим систему (0, 1) буквой х, 

х = (0, 1). 

Тогда, применяя указанное выше определение умножения, мы полу- 
чим, что х 2 =(0, 0, 1) и вообще 

х к — {0, 0, . . . , 0, 1). (3) 

к раз 

Используя теперь определения сложения и умножения упорядо- 
ченных систем, а также равенства (2) и (3), мы получим: 

(«О- ^1’ ^2’ • • ^п — 1т 

== { <г о)"Ь(0| й і) + (0, а 2 ) . 

...+(0, 0, ..., 0, а„_ г ) -Ь (0, 0, .... 0, а п ) = 

п — і раз п раз 

= (°о) + ( а і) (0, 1) + (а 2 )(0, 0, 1)+... 

• • • + ( а п -і) (О, о, 0, 1) + К)(0, 0, ..., О, 1) = 

п - і раз п раз 

= а^х &П- 1*^ 1 ~г а п х . 
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Таким образом, всякая упорядоченная система вида (1) может 
быть записана в виде многочлена относительно х с коэффициентами 
из поля Я, причем эта запись будет, очевидно, однозначной. Опи- 
раясь, наконец, на уже доказанную коммутативность сложения, 
можно перейти к записи по убывающим степеням х. 

Мы построим, следовательно, коммутативное кольцо, которое 
естественно назвать кольцом многочленов от неизвестного х над 
полем Р. Это кольцо обозначается символом Р[дг]. 

В кольце Р[ х] содержится само поле Р, как уже было пока- 
зано выше. Далее, как и в случае колец многочленов над числовыми 
полями (см. § 20), кольцо Р[х] обладает единицей, не содержит 
делителей нуля и не является полем. 

Если поле Р содержится в большем поле Р, то кольцо Р[х\ 
будет подкольцом кольца Я [л;]: всякий многочлен с коэффициен- 
тами из Р можно считать, понятно, многочленом и над полем Р, 
а сумма и произведение многочленов зависят,только от их коэффи- 
циентов и поэтому не меняются при переходе к большему полю. 

Для того чтобы лучше представить себе истинный объем понятия 
«кольцо многочленов над полем Я», посмотрим на него еще с одной 
стороны. 

Пусть поле Я содержится в качестве подкольца в некотором 
коммутативном кольце Ь. Элемент а кольца Ь называется алгебраи- 
ческим над полем Я, если существует такое уравнение п- й степени, 
лЭ* 1, с коэффициентами из поля Я, которому элемент сс удовлетво- 
ряет; если же такого уравнения не существует, то элемент сс назы- 
вается трансцендентным над полем Я. Понятно, что элемент х 
кольца Я[дг] трансцендентен над полем Я. 

Справедлива следующая теорема: 

Если элемент а кольца і трансцендентен над полем Р, то 
подкольцо V , полученное присоединением элемента сс к полю Я 
(т. е. минимальное подкольцо кольца і, содержащее поле Я и эле- 
мент а), изоморфно кольцу многочленов Р\х\. 

В самом деле, всякий элемент {5 кольца /,, который может быть 
записан в виде 

Р = а 0 а п -р а 1 а п ~ 1 + . . . + а п -і&-р а п , п^ 0, (4) 

с коэффициентами а 0 , а ѵ . . ., а в _ 1 , а п из поля Я, будет содержаться 
в подкольце V . Элемент |3 не может обладать двумя различными 
записями вида (4), так как, вычитая из одной записи другую, мы 
получили бы, что существует уравнение над полем Я, удовлетворяе- 
мое элементом а, в противоречие с трансцендентностью этого эле- 
мента. Складывая элементы вида (4) по правилам сложения в кольце/,, 
можно, понятно, складывать коэффициенты при одинаковых степе- 
нях а; это совпадает, однако, с правилом сложения многочленов. 
С другой стороны, перемножая элементы вида (4) по правилам 
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умножения в кольце Ь, мы можем, пользуясь законом дистрибутив- 
ности, совершить почленное перемножение, а затем собрать подоб- 
ные члены; это приводит, очевидно, к известному нам правилу 
умножения многочленов. Этим доказано, что элементы вида (4) со- 
ставляют в кольце 7, подкольцо, содержащее поле Р и элемент а, 
т. е. совпадающее с V , и что это подкольцо изоморфно кольцу 
многочленов Р[х]. 

Мы видим, что сделанный выше выбор определений для операций 
над многочленами не был случайным: он вполне определяется тем, что 
элемент х кольца Р[х) должен быть трансцендентным над полем Р. 

Заметим, что при построении кольца многочленов Р[х\ мы нигде 
не использовали деления элементов поля Р и лишь один раз, 
а именно, при доказательстве утверждения о степени произведения 
многочленов, должны были бы сослаться на отсутствие в поле Р 
делителей нуля. Можно, следовательно, взять произвольное комму- 
тативное кольцо Ь и, повторяя проведенное выше построение, по- 
лучить кольцо многочленов Ь [лс] над кольцом Р, если при этом 
кольцо 7. не содержит делителей нуля, то степень про- 
изведения многочленов будет равна сумме степеней сомножителей 
и поэтому кольцо многочленов 7. [дг] также не будет 
содержать делителей нуля. 

Возвращаясь к многочленам с коэффициентами из произвольного 
поля Р, заметим, что на этот случай переносится по существу вся 
теория делимости многочленов, изложенная в §§ 20 — 22 
нашей книги. Именно, в кольце Р[х) имеет место алгоритм 
деления с остатком, причем и частное, и остаток сами будут при- 
надлежать к кольцу Р[х]. Далее, в кольце [л;] имеет смысл по- 
нятие делителя и сохраняются все его основные свойства. При 
этом то обстоятельство, что алгоритм деления не выводит за пре- 
делы основного поля Р, позволяет утверждать, что свойство много- 
члена ф (х) быть делителем для /(х) не зависит от того, рас- 
сматриваем ли мы поле Р или же его любое расширение. 

В кольце Р[х\ сохраняются также определение и все свой- 
ства наибольшего общего делителя, в том числе сохраняются 
алгоритм Евклида и теорема, доказанная в § 21 при помощи 
этого алгоритма. Заметим, что так как алгоритм деления с остат- 
ком не зависит, как мы знаем, от того, какое поле выбрано в качестве 
основного, то можно утверждать, что наибольший общий делитель 
двух данных многочленов также не зависит от того, рассмат- 
риваем ли мы поле Р или же его произвольное расширение Р. 

Наконец, для многочленов над полем Р сохраняет смысл по- 
нятие корня и остаются справедливыми основные свойства кор- 
ней. Сохраняется и теория кратных корней; впрочем, к этому во- 
просу мы вернемся еще раз в конце следующего параграфа. 

Эти замечания позволят нам в дальнейшем при изучении много- 
членов над любым полем Р ссылаться на § 20 — 22. 
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§ 48. Разложение многочленов на неприводимые множители 

На основании теоремы о существовании корня в § 24 для полей 
комплексных и действительных чисел были доказаны существование 
и единственность разложения многочлена на неприводимые множи- 
тели. Эти результаты являются частными случаями общих теорем, 
относящихся к многочленам над произвольным полем Р. Настоящий 
параграф посвящается изложению этой общей теории, параллельной 
теории разложения целых чисел на простые множители. 

Определим сначала те многочлены, которые играют в кольце 
многочленов такую же роль, какую в кольце целых чисел играют 
простые числа. Заранее подчеркнем, что в этом определении будет 
идти речь лишь о многочленах, степень которых больше 
или равна единице; это вполне соответствует тому, что при 
определении простых чисел и изучении разложений целых чисел на 
простые множители числа Іи — 1 исключаются из рассмотрения. 

Пусть дан многочлен /( х ) степени л, п ^ 1, с коэффициентами 
из поля Р. Ввиду свойства V из § 21 все многочлены нулевой степени 
будут служить делителями для /( х ). С другой стороны, по VII, дели- 
телями для /( х ) будут и все многочлены с/(.ѵ), где с — отличный 
от нуля элемент из Р, причем ими исчерпываются все делители 
многочлена /(х), имеющие степень п. Что же касается делителей 
для /( х ), степень которых больше 0, но меньше п, то они могут 
в кольце Р[ж] существовать, а могут и отсутствовать. В первом 
случае многочлен /(х) называется приводимым в поле Р (или над 
полем Р), во втором случае — неприводимым в этом поле. 

Вспоминая определение делителя, можно сказать, что многочлен 
/{х) степени п приводим в поле Р, если он может быть разложен 
над этим полем ( т . е. в кольце Р[лг]) в произведение двух мно- 
жителей, степени которых меньше п: 

Д*)=Ф(*Ж*), (1) 

и /(х) неприводим в поле Р, если в любом его разложении вида 
(1) один из множителей имеет степень 0, другой — степень п. 

Следует обратить особое внимание на то обстоятельство, что 
о приводимости или неприводимости многочлена можно говорить 
лишь по отношению к данному полю Р, так как многочлен, непри- 
водимый в этом поле, может оказаться приводимым в некотором 
его расширении Р. Так, многочлен х* — 2 с целыми коэффициентами 
неприводим в поле рациональных чисел — он не может быть разло- 
жен в произведение двух множителей первой степени с рациональ- 
ными коэффициентами. Однако в поле действительных чисел этот 
многочлен оказывается приводимым, как показывает равенство 


х 2 — 2 = (х—у г 2 ) {х+Ѵ 2 ). 
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Многочлен х 2 -(- 1 неприводим не только в поле рациональных чисел, 
но и в поле действительных чисел; он делается приводимым, однако, 
в поле комплексных чисел, так как 

х 2 +\—(х— і) (х + і). 

Укажем некоторые основные свойства неприводимых многочленов, 
причем будем помнить, что речь идет о многочленах, неприводимых 
в поле Р. 

а) Всякий многочлен первой степени неприводим. 

В самом деле, если бы этот многочлен был разложим в произве- 
дение множителей меньшей степени, то эти множители должны были 
бы иметь степень 0. Однако произведение любых многочленов нуле- 
вой степени снова будет многочленом нулевой степени, а не первой. 

р) Если многочлен р(х) неприводим , то неприводимым будет 
и всякий многочлен ср(х), где с — отличный от нуля элемент 
из Р. 

Это свойство следует из свойств 1 и VII § 21. Оно позволит нам 
там, где это будет нужно, ограничиваться рассмотрением неприво- 
димых многочленов, старшие коэффициенты которых равны единице. 

■у) Если / (х) — произвольный, а р(х) — неприводимый много- 
член, то либо /(х) делится на р (х), либо же эти многочлены 
взаимно просты. 

Если {/(х), р {х)) — й (х), то д(х), будучи делителем неприво- 
димого многочлена р{х), либо имеет степень 0, либо же есть много- 
член вида ср(х), сф 0. В первом случае /(х) и р(х) взаимно 
просты, во втором /(а) делится на р{х). 

б) Если произведение многочленов /(х) и §(х) делится на не- 
приводимый многочлен р (х), то хотя бы один из этих множи- 
телей делится на р{х). 

Действительно, если /(х) не делится на р{х), то, по у), /{х) 
и р(х) взаимно просты, а тогда, по свойству б) из § 21, много- 
член §(х) должен делиться на р(х). 

Свойство б) без труда распространяется на случай произведения 
любого конечного числа множителей. 

Следующие две теоремы являются главной целью всего настоя- 
щего параграфа. 

Всякий многочлен /( х ) из кольца Р[х], имеющий степень п, 
1, разлагается в произведение неприводимых множителей. 

Действительно, если многочлен /(х) сам неприводим, то указан- 
ное произведение состоит всего из одного множителя. Если же он 
приводим, то может быть разложен в произведение множителей 
меньшей степени. Если среди этих множителей снова имеются при- 
водимые, то производим их дальнейшее разложение на множители, 
и т. д. Этот процесс должен остановиться после конечного числа 
шагов, так как при любом разложении /(х) на множители сумма 
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степеней этих множителей должна равняться п и поэтому число 
множителей, зависящих от х, не может превосходить п. 

Разложение целых чисел на простые множители однозначно, если 
ограничиваться рассмотрением целых положительных чисел. Однако 
в кольце всех целых чисел однозначность имеет место лишь с точ- 
ностью до знаков: так, — 6 = 2 •( — 3) = ( — 2) - 3, 10 = 2-5 = 

= ( — 2)-( — 5) и т. д. Аналогичное положение имеет место и 
а кольце многочленов. Если 

/( х ) — Рі {х) Р 2 (х) ... р 5 (х) 

есть разложение многочлена /( х ) в произведение неприводимых мно- 
жителей и если элементы с 1( с 2 , . с 5 из поля Р таковы, что их 
произведение равно 1, то 

/{х) = [с 1 р 1 (х)[ • [с 2 р 2 (х )} . . . (х)) 

также будет, ввиду (5), разложением /(х) в произведение неприво- 
димых множителей. Оказывается, что этим исчерпываются все 
разложения /(х): 

Если многочлен /{х) из кольца Р[х] двумя способами разло- 
жен в произведение неприводимых множителей: 

/(х)=Рі (х) Рі (X) ... р, (х) = < 7 ! (х) (х) ... <7, (х), (2) 

то $ — і и, при соответствующей нумерации, имеют место 
равенства 

Яі (х) = с і р і (х), і = 1, 2, .... 5, (3) 

где с ,- — отличные от нуля элементы из поля Р. 

Эта теорема верна для многочленов первой степени, так как они 
неприводимы. Мы будем поэтому вести доказательство индукцией 
[іо степени многочлена, т. е. будем доказывать теорему для /(х), 
предполагая, что для многочленов меньшей степени она уже доказана. 

Так как () 1 (х) является делителем для /(х), то, ввиду свой- 
ства 6) и равенства (2), ^ (х) будет делителем хотя бы для одного 
из многочленов р,-(х), например для р х (х). Так как, однако, много- 
член /3] (х) неприводим, а степень Ц х (х) больше нуля, то существует 
такой элемент с ъ что 

9 1 (х) = с 1 /з 1 (х). (4) 

Подставляя это выражение (х) в (2) и сокращая на р х (х) (что 
законно, так как в кольце Р[х] нет делителей нуля), мы получим 
равенство 

р 2 {х)р в (х) ... рА х )= : [с 1 (і 2 {х)]Яз(х) ... Яі (х). 

Так как степень многочлена, равного этим произведениям, меньше 
степени /(х), то уже доказано, что 5 — 1 —і — 1, откуда в—і , 
и что существуют такие элементы с 2 , с 3 , . . , , с 4 , что с' г р 2 (х) = с х д 2 (х), 
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откуда (*) = ( с-< с' ) р а (х), и с ! р і (х)=<> і (х), 2 = 3, У. Пола- 
гая с~ 1 с — с 2 и учитывая (4), мы полностью получим равенства (3). 

Доказанной сейчас теореме можно дать такую более короткую 
формулировку, всякий многочлен разлагается на неприводимые 
множители однозначно с точностью до множителей нулевой 
степени. 

Всегда можно рассматривать, впрочем, разложение следующего 
специального вида, которое будет для каждого многочлена уже 
вполне однозначным-, берем любое разложение многочлена /( х ) 
на неприводимые множители и из каждого из этих множителей 
выносим за скобки старший коэффициент. Мы получим разложение 

/(*) = а 0 р 1 {х)р 2 (х) ... р 5 (х), (5) 

где все р ; (х), 2 = 1, 2, ..., „ѵ, являются неприводимыми многочле- 
нами со старшими коэффициентами, равными единице. Множитель а 0 
будет равен старшему коэффициенту многочлена /(х), как легко 
доказать, выполнив перемножение в правой части равенства (5). 

Неприводимые множители, входящие в разложение (5), не обязаны 
быть все различными. Если неприводимый многочлен р (х) встречается 
в разложении (5) несколько раз, то он называется кратным множи- 
телем для /(х), а именно к-кратным (в частности двукратным, 
трехкратным и т, д.), если в разложении (5) содержится ровно к 
множителей, равных р (х). Если же множитель р(х) входит в (5) 
лишь один раз, то он называется простым (или однократным ) 
множителем для /( х ). 

Если в разложении (5) множители р г ( х ), р г (л;), (х) отличны 

друг от друга, а всякий другой множитель равен одному из них, 
и если Р;(х), 2 = 1, 2, ..., /, является А.-кратным множителем 
многочлена /{х), то разложение (5) можно переписать в следующем 
виде: 

/(х) = а 0 р^(х)р к ^(х) ... р к ‘( х). (С) 

Именно этой записью мы будем дальше обычно пользоваться, не 
оговаривая особо, что показатели равны кратностям соответствующих 
множителей, т. е. что р і (х) ф р^ (х) при іф]. 

Если даны разложения ліногочленов / (х) и §(х) на неприводи- 
мые множители, то наибольший общий делитель й ( х ) этих 
многочленов равен произведению множите лей, входящих одновре- 
менно в оба разложения, причем каждый множитель берется 
в степени, равной меньшей из его кратностей в обоих данных 
многочленах. 

Действительно, указанное произведение будет делителем для каж- 
дого из многочленов /(х), $(х), а поэтому и для й{х). Если бы это 
произведение было отличным от й {х), то в разложении й {х) на 
неприводимые множители либо содержался бы множитель, который 
не входит в разложение хотя бы одного из многочленов /(х) и ^(л;), 
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что невозможно, либо же один из множителей имел бы большую 
степень, чем он имеет в разложении одного из многочленов /(х) 
и &(х), что снова невозможно. 

Эта теорема аналогична тому правилу, по которому разыскивается 
обычно наибольший общий делитель целых чисел. Она не может 
заменить, однако, в случае многочленов алгоритм Евклида. Действи- 
тельно, так как простых чисел, меньших данного целого положитель- 
ного числа, лишь конечное число, то разложение целого числа на 
простые множители достигается конечным числом проб. Это уже 
не имеет места в кольце многочленов над бесконечным основным 
полем, и в общем случае нельзя дать способа для практического 
разложения многочленов на неприводимые множители. Больше того, 
даже решение вопроса, является ли многочлен /( х ) неприводимым 
в данном поле Р, оказывается в общем случае весьма трудным. Так, 
описание всех неприводимых многочленов для случая полей ком- 
плексных и действительных чисел было получено в § 24 в качестве 
следствия из очень глубокой теоремы о существовании корня. Что же 
касается поля рациональных чисел, то о многочленах, неприводимых 
над этим полем, в § 56 будут сделаны лишь некоторые высказы- 
вания частного характера. 

Мы показали, что в кольце многочленов, как и в кольце целых чисел, 
имеет место разложение на «простые» (неприводимые) множители и что это 
разложение в некотором смысле однозначно. Возникает вопрос, можно ли 
перенести эти результаты на более широкие классы колец. Мы ограничимся 
при этом случаем таких коммутативных колец, которые обладают единицей 
и не содержат делителей нуля. 

Назовем делителем единицы такой элемент а кольца, для которого 
в этом кольце существует обратный элемент а~ 1 , 

аа~ Л ~ 1. 

В кольце целых чисел это будут числа 1 и — 1, в кольце многочленов 
Р[х]- — все многочлены нулевой степени, т. е. отличные от нуля числа из 
поля Р. Элемент с, отличный от нуля и не являющийся делителем единицы, 
назовем простым элементом кольца, если во всяком его разложении в про- 
изведение двух множителей, с=аЬ, один и?, этих множителей непременно 
является делителем единицы. В кольце целых чисел простыми элементами 
будут простые числа, в кольце многочленов — неприводимые многочлены. 

Будет ли всякий элемент рассматриваемого кольца, отличный от нуля и 
не являющийся делителем единицы, разлагаться в произведение простых 
множителей? Если да, то будет ли такое разложение однозначным? Последнее 
нужно понимать в таком смысле: если 


а — РіРг ■ - • Рк — Я іЯг — Яі 

— два разложения элемента а на простые множители, то к=1 и (возможно, 
после изменения нумерации) 

Чі — РіЯР < = Е 2, к, 
где сі — делитель единицы. 

Оказывается, что в общем случае на оба вопроса должен быть дан от- 
рицательный ответ. Мы ограничимся одним примером, а именно, укажем 
кольцо, в котором разложение на простые множители 
хотя и возможно, но не является однозначным. 
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Рассмотрим комплексные числа вида 

<х = а-)-ЬУ — 3, (7) 

где а и Ь — целые числа. Все такие числа составляют кольцо без делителей 
нуля, содержащее единицу; действительно, 

(а + Ь ]^=3) (с + гі У=3) = (ас — ЗЬй) + (Ьс + ай) У^З. (8) 

Назовем нормой числа а—а-\-Ь У — 3 целое положительное число 

N (а) = а 2 -)- ЗЬ 2 . 

Ввиду (8) норма произведения равна произведению норм , 

АЧаР)=ЛГ(а)Л'(Р). (9) 

Действительно, 

(ас — 3 Ьй) 3 + 3 (Ьс + ай) 2 = аѴ + 9Ь 2 <2 2 + 3 ЬѴ + 3 аЧ 2 = (а 2 + ЗЬ 2 ) (с 2 + Зй 2 ). 

Если число а является в нашем кольце делителем единицы, т. е. число 
а -1 также имеет вид (7), то, по (9), 

ІѴ (<х)-Л г (а -І ) = Л т (аа _1 ) = Л 7 (1) = 1, 

а поэтому ІѴ(а) = 1, так как числа N (а) и іѴ(а -1 ) — целые и положительные, 
Если а = а + Ь V — 3, то из ІѴ(а) = 1 следует 

ІѴ(а) = а 2 +ЗЬ 2 =1; 

это возможно, однако, лишь при й = 0, а=± 1. Таким образом, в нашем 
кольце , как и в кольце целых чисел, делителями единицы будут лишь числа 
Іи — 1 и лишь эти числа имеют норму, равную единице. 

Равенство (9) для нормы произведения переносится, понятно, на случай 
любого конечного числа множителей. Отсюда легко вывести, что всякое 
число а из нашего кольца может быть разложено в произведение конечного 
числа простых множителей; проведение доказательства мы предоставим 
читателю. 

Однозначность разложения на простые множители уже нельзя, однако, 
утверждать. Справедливы, например, равенства 

4 == 2 • 2 — ( 1 + ^^З) (1— У^З). 


В нашем кольце нет других делителей единицы, кроме чисел Іи — 1, а по- 
этому число 1 + У — 3 (как и число 1 — У — 3) не может отличаться от 
числа 2 лишь на множитель, являющийся делителем единицы. Нам остается 
показать, что каждое из чисел 2, 1 + У — 3, 1 — У — 3 будет е рассматри- 
ваемом кольце простым. Действительно, норма каждого из этих трех чисел 
равна числу 4. Пусть а — любое из этих чисел и пусть 

а=Ру. 

Тогда, по (9), возможен один из трех случаев; 

1) N (Р) = 4, N (ѵ)= 1; 2) ІѴ(Р)=1, ІѴ( Ѵ ) = 4; 3) іѴ(Р) = ЛЧу) = 2. 

В первом случае число у будет, как мы знаем, делителем единицы, во вто- 
ром случае делителем единицы будет р. Что же касается третьего случая, 
то он вообще невозможен ввиду невозможности равенства 


при целых а и Ь. 


а 2 +ЗЬ 2 =2 


Кратные множители. Хотя, как уже указано выше, мы не умеем 
разлагать многочлены на неприводимые множители, тем не менее 
существуют методы, позволяющие узнать, обладает ли данный мно- 
гочлен кратными множителями, и в случае положительного ответа 
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дающие возможность свести изучение этого многочлена к изучению 
многочленов, уже не содержащих кратных множителей. Эти методы 
требуют, однако, наложения некоторых ограничений на основное 
поле. Именно, все дальнейшее содержание настоящего параграфа 
будет излагаться в предположении, что поле Р имеет характе- 
ристику 0. Без этого ограничения теоремы о кратных множителях, 
которые будут доказаны ниже, уже теряют силу; вместе с тем, 
с точки зрения приложений, случай полей характеристики нуль 
является наиболее важным, так как сюда относятся, в частности, 
все числовые поля. 

Заметим сначала, что на рассматриваемый случай переносятся 
и понятие производной многочлена, введенное в § 22 для 
многочленов с комплексными коэффициентами, и основные свойства 
этого понятия *). Докажем теперь следующую теорему: 

Если р (х) является к-кратньш неприводимым множителем 
многочлена /(х), к^\, то он будет (к — 1 )-кратным множи- 
телем производной этого многочлена. В частности, простой 
множитель многочлена не входит в разложение производной. 

В самом деле, пусть 

/(х)=р к (х)§{х), (10) 

причем ^(д:) уже не делится на р (х). Дифференцируя равенство (10), 
получаем: 

/' (*) (х) § (х) + кр к ~ 1 (х)р' (х) § (*) = 

=р к - 1 (X) [р (х) 8' (х) + кр' (х) 8(х)]. 

Второе из слагаемых, стоящих в скобках, не делится на р (х); дей- 
ствительно, 8І Х ) не делится на р{х) по условию, р' (х) имеет 
меньшую степень, т. е. также не делится на р (х), а отсюда, ввиду 
неприводимости многочлена р (х) и свойств б) из настоящего пара- 
графа и IX из § 21, следует наше утверждение. С другой стороны, 
первое слагаемое суммы, стоящей в квадратных скобках, делится 
на р(х), а поэтому вся эта сумма не может делиться на р (х), т. е. 
множитель р (х) на самом деле входит в /' (х) с кратностью к — 1. 

Из нашей теоремы и из указанного выше способа разыскания 
наибольшего общего делителя двух многочленов следует, что если 
дано разложение многочлена / {х) на неприводимые множители: 

/{х) = а 0 р^(х)р^(х) ... р к ^(х), (И) 

то наибольший, общий делитель многочлена /(х) и его производ- 
ной обладает следующим разложением на неприводимые множи- 
те лі и: 

і/{х), /' {х)) = р к 1 '- 1 {х)р^~ 1 (х) ... р к ‘- 1 {х), (12) 


*) Для полей конечной характеристики теряет силу утверждение, что 
производная многочлена степени п имеет степень п — 1. 
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где, понятно, множитель р к р~' (х) следует при 1 заменять еди- 
ницей. В частности, многочлен / (х) тогда и только тогда не со- 
держит кратных множителей, если он взаимно прост со своей 
производной. 

Мы научились, следовательно, отвечать на вопрос о существо- 
вании кратных множителей у данного многочлена. Больше того, так 
как ни производная многочлена, ни наибольший общий делитель двух 
многочленов не зависят от того, рассматриваем ли мы поле Р или 
его любое расширение Р , то в качестве следствия из доказанного 
сейчас результата мы получаем: 

Если многочлен / (х) с коэффициентами из поля Р характе- 
ристики нуль не имеет над этим полем кратных множителей, 
то у него не будет кратных множителей ни над каким расши- 
рением Р поля Р. 

В частности, если /{х) неприводим над Р, а Р — некоторое рас- 
ширение поля Р, то, хотя /(х) уже может быть над Р приводимым, 
однако заведомо не будет делиться на квадрат неприводимого 
(над Р) многочлена. 

Выделение кратных множителей. Если дан многочлен /{х) 
с разложением (11) и если через (х) мы обозначим наибольший 
общий делитель /(х) и его производной /' (х), то (12) будет разло- 
жением для д 1 (х). Деля (11) на (12), мы получим: 

Нх) 

ѵ і (*) = = в«Л (*) Рг (X) • • • Рі (X), 

т. е. получим многочлен, не содержащий кратных множителей, причем 
всякий неприводимый множитель для ѵ х (х) будет множителем и 
для /(х). Этим разыскание неприводимых множителей для /(х) сво- 
дится к разысканию их для многочлена ѵ 1 (х), имеющего, вообще 
говоря, меньшую степень и, во всяком случае, содержащего лишь 
простые множители. Если эта задача для ѵ г (х) будет решена, то 
останется определить лишь кратность найденных неприводимых 
множителей в /(х), что достигается применением алгоритма деления. 

Усложняя изложенный сейчас метод, можно сразу перейти к рассмотре- 
нию нескольких многочленов без кратных множителей, причем, найдя непри- 
водимые множители этих многочленов, мы не только найдем все неприводи- 
мые множители для / (х), но и будем знать их кратности. 

Пусть (11) будет разложением / (х) на неприводимые множители, причем 
наивысшая кратность множителей есть 5, 53*1. Обозначим через Р г {х) про- 
изведение всех однократных множителей многочлена [ (х), через Р 2 (х) — 
произведение всех двукратных множителей, но взятых лишь по одному разу, 
и т. д., наконец, через Р 5 (х) — произведение всех 5-кратных множителей, 
также взятых лишь по одному разу; если при этом для некоторого / в / (х) 
отсутствуют /-кратные множители, то полагаем р^■(x)= 1. Тогда ( (х) будет 
делиться на к-ю степень многочлена Р^(х), к — 1, 2, .... 5, и разложение" (11) 
примет вид 

І(х) = а 0 Р 1 (х) РЦх) РЦх) ... РЦх), 
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а разложение (12) для й х (х) = (I, (х), /' (х)) перепишется в виде 
(*) = С 2 (х) Р\ (х)...РІ~ 1 (х). 

Обозначая через (х) наибольший общий делитель многочлена ^(х) 
и его производной и вообще через гід, (х) наибольший общий делитель 
многочленов (1 к _ 1 (х) и <І к _ 1 (х), мы таким же путем получим: 

<і г (X) = Р а (X) Р\ (X) ... Р $ ~ 2 (X), 

а, (Х)=р, (х) Рі (х)... р*-* (х), 


= (*). 

й, (х)=1. 

Отсюда 

ѵ і (X) = = о,,/ 7 ! (X) Рі (х) Р 3 (х) . . . Е,, (х). 

Ъ(х)=^=Р г ( х ) Р 3 (х ) ... ЕДх), 

ѵЛх)= Ш) гМ*)...М*). 


В ' ( * )в М| )в ^ (х) - 


и поэтому, наконец, 


Р 1 (х) = 


Ѵі (х) 

а 0 ѵ 2 (х) ’ 


Рі ( х ) = 


»2 (*) 
«з (х) ’ 


Р^ (х) = 00 - 


Таким образом, пользуясь лишь приемами, не требующими знания непри- 
водимых множителей многочлена [ (х), а именно взятием производной, 
алгоритмом Евклида и алгоритмом деления, мы можем найти многочлены 
Р\ (х), Р 2 (х), ..., ЕДх) без кратных множителей, причем всякий непри- 
водимый множитель многочлена Р к (х), к = 1, 2, ..., 5, будет й-кратным 
для /(х). 

Изложенный здесь метод нельзя, понятно, считать методом для разло- 
жения многочлена на неприводимые множители, так как для случая 5=1, 
Т. е. для многочлена без кратных множителей, мы получим лишь І(х) — Р х (х). 


§ 49*. Теорема существования корня 

Само собою разумеется, что доказанная в § 23 основная теорема 
о существовании для всякого числового многочлена корня в поле 
комплексных чисел не может быть перенесена на случай произволь- 
ного поля, В настоящем параграфе будет доказана теорема, в не- 
которой мере заменяющая в общей теории полей указанную основ- 
ную теорему алгебры комплексных чисел. 

Пусть дан многочлен /( х ) над полем Р. Естественно возникает 
следующий вопрос: если многочлен /( х ) вообще не имеет корней 
в поле Р, то существует ли такое расширение Р поля Р, в котором 
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для / (х) уже найдется хотя бы один корень? При этом можно 
считать, что степень многочлена /( х ) больше единицы: для много- 
членов нулевой степени вопрос не имеет смысла, а всякий многочлен 

первой степени ах-\-Ь обладает корнем — — в самом поле Я. 

С другой стороны, можно ограничиться, очевидно, случаем когда 
многочлен /( х ) неприводим: если он приводим над Я, то корень 
любого из его неприводимых множителей будет служить корнем 
и для него самого. 

Ответ на интересующий нас вопрос дает следующая теорема 
существования корня: 

Для всякого многочлена ф{х), неприводимого над полем Р, 
существует такое расширение этого поля, в котором содер- 
жится корень для /(х). Все минимальные поля, содержащие 
поле Р и какой-либо корень этого многочлена, изоморфны между 
собой. 

Докажем сначала вторую половину этой теоремы. 

Пусть дан неприводимый над Р многочлен 

/(х) — а 0 х п 4- а х х п 1 • • • + а п -і х + а „> 0) 

причем п 5=2, т. е. /(х) не имеет корней в самом поле Р. Предпо- 
ложим, что существует расширение Р поля Р , содержащее корень а 
для /( х ), и докажем следующую лемму, необходимую для даль- 
нейшего, но представляквдую и самостоятельный интерес: 

Если лежащий в Р корень а многочлена /( х ), неприводимого 
над Р, служит корнем также для некоторого многочлена § (х) 
из кольца Р[х\, то /(х) будет делителем для %{х). 

В самом деле, над полем Р многочлены /(х) и §(х) обладают 
общим делителем х — а и поэтому не являются взаимно простыми. 
Свойство многочленов не быть взаимно простыми не зависит, однако, 
от выбора поля, поэтому можно перейти к полю Р и применить 
свойство у) из предшествующего параграфа. 

Найдем теперь минимальное подполе Я (ос) поля Я, содержащее 
поле Я и элемент а. К нему заведомо принадлежат все элементы 
вида 

Р — “1" ^і а + Ъ 2 а? + . . . + Ь п _ 1 ос п х , (2) 

где Ь ъ Ь. 2 , . . . , Ь п _ г — элементы поля Я. Никакой элемент поля Я 
не может обладать двумя различными записями вида (2): если имеет 
место также равенство 

Р = с 0 +с 1 а + с 2 а 2 + • • • + с„_ 1 ос' ! " 1 , 


причем хотя бы при одном к с к Ф Ь к , то а будет корнем многочлена 
§{х) = (Ь 0 — с 0 ) + (Ьі — с 1 )х+(Ь 2 — с 2 )х 2 +...+{Ъ п _ 1 — с п _ 1 )х п - 1 , 
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что противоречит доказанной выше лемме, так как степень ^(лг) 
меньше степени / (х). 

К числу элементов поля Р, имеющих вид (2), принадлежат все 
элементы поля Р (при Ь х — Ь 2 — . . . = Ь п _ 4 = 0), а также сам эле- 
мент а (при Ь х = 1, Ь 0 = Ь 2 = . . . — Ь п _ 1 = 0). Докажем, что эле- 
менты вида (2) составляют все искомое подполе Р(сс). В самом 
деле, если даны элементы (3 (с записью (2) ) и 

Т = с 0 + с 1 а+с 2 а 2 + ... +с„. 1 а"- 1 , 

то, на основании свойств операций в поле Р, 

Р ±7 = ( 6 о± с о)+і ь і ± с і)«-+ ± с і )а 2 + ... + {Ь п _ 1 ± с п _ г ) а” -1 , 

т. е. сумма и разность двух любых элементов вида (2) снова будут 
элементами такого же вида. 

Если мы перемножим р и у, то получим выражение, содержащее а" 
и более высокие степени а. Однако из (1) и равенства /(а) = 0 
вытекает, что а“, а поэтому и а п+1 , а п+2 и’т. д. , можно выразить 
через меньшие степени элемента а. Наиболее простой способ 
разыскания выражения для Ру состоит в следующем: пусть 

ф(*)=А + &!*+ • • • +Ь„-іХ п - 1 , і|з (х) = с 0 -^-с 1 х-\- . . . +с п _ 1 х п -\ 

откуда ф(а) = р, ф(а) = у. Перемножим многочлены ф (х) и ф(х) 
и разделим это произведение на /(х); мы получим 

Ф (■*) Ф (X) = / (X) <](Х) + Г {х), (3) 

где 

г(х) = а а + а 1 х+ ... +а п _ 1 х п - 1 . 

Беря значения обеих частей равенства (3) при х = ос, мы получим: 

ф (а) ф (а) = / (а) ц (а) + г (а), 
т. е. , ввиду /(а) = 0, 

РѴ = <*о + <*і« + .••+<*„- іа" -1 . 

Таким образом, произведение двух элементов вида (2) снова будет 
элементом такого же вида. 

Покажем, наконец, что если элемент р имеет вид (2), причем 
Р Ф 0, то элемент (3~ г , существующий в поле Р, также может быть 
записан в виде (2). Для этого возьмем многочлен 

Ч>{х) = Ь 0 + Ь 1 х+ ...+Ь п _ 1 х п - 1 

из кольца Р\х]. Так как степень ф (х) ниже степени /(х), а много- 
член /(х) неприводим над Р, то ф (х) и /(х) взаимно просты и 
поэтому, по §§ 21 и 47, в кольце Р[х] существуют такие много- 
члены и{х) и ѵ(х), что 

ф(лг)и(х) +/(*) о (*)■■=!; 
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можно считать при этом, что степень и (х) меньше п : 

и (х) = у 0 + 8 п-і х "~ 1 - 


Отсюда, ввиду равенства /(ос) — 0, следует: 

ф (ос) и(сс) — 1 

и поэтому, ввиду равенства ф(ос) = р, мы получаем: 

р - 1 = а(а) = у 0 + $ 1 а+ . . . +$„_ 1 а п - 1 . 

Таким образом, совокупность элементов поля Р, имеющих вид (2), 
составляет подполе поля Р\ это и будет искомое поле Р( а). Так как 
мы видели, далее, что при разыскании суммы и произведения эле- 
ментов р и у вида (2) нужно знать лишь коэффициенты выражений 
этих элементов через степени а, то можно утверждать справедли- 
вость следующего результата: если существует, помимо Р, другое 
расширение Р' поля Р, также содержащее некоторый корень а' 
многочлена /(х), и если Р(а') есть минимальное подполе поля Р 1 , 
содержащее Р и а', то поля Р(а) и Р(а) будут изоморфными, 
причем для получения изоморфного соответствия между ними нужно 
элементу р вида (2) из Р( а) сопоставить элемент 

Р’ = ^о + &і а ' + Ъ 2 а' 2 + . . . -\~Ъ п _ 

из Р(а'), имеющий те же коэффициенты. Этим доказана вторая 
половина теоремы. 

Переходим к доказательству основной первой половины этой тео- 
ремы, причем изложенное выше подскажет нам пути для этого. Нам 
дан многочлен /(х) степени п 3*2, неприводимый над полем Р, и 
нужно построить расширение поля Р, содержащее корень для /(х). 
Для этого возьмем все кольцо многочленов Р\х) и разобьем его 
на непересекающиеся классы, отнеся в один класс многочлены, 
дающие при делении на заданный нам многочлен /(х) одинаковые 
остатки. Иными словами, многочлены ф(л:)иф(л:) относятся к одному 
классу, если их разность нацело делится на /(х). 

Условимся обозначать полученные классы буквами А, В, С и т. д. 
и следующим вполне естественным способом определим сумму и 
произведение классов. Возьмем любые два класса А и В, выберем 
в классе А некоторый многочлен ср 1 (л*), в классе В — некоторый 
многочлен ф 1 (х) и обозначим через Хі ( х ) сумму этих многочленов, 

Хі(*)=Фі (•яО+'Фг (■*). 

а через Ѳ х (х) — их произведение, 

Ѳ 1 (л:) = ф 1 (л-)-фі (х). 
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Выберем теперь в классе А любой другой многочлен ф 2 (х), в классе 
В — любой многочлен »1) 2 (х) и обозначим через %% (х) и Ѳ 2 (лг) соот- 
ветственно их сумму и произведение: 

%2 (х) = Ф 2 (лг) + ф 2 (х), 

Ѳ 2 (х) = ф 2 (х)-ф 2 (х). 

По условию многочлены <р х (лг) и ф 2 (х) лежат в одном классе А, 
а поэтому их разность ф х (х) — ф 2 (лг) нацело делится на /(лг); этим 
же свойством обладает и разность г[5 1 (лг) — -ф 2 (лг). Отсюда следует, 
что разность 

Хі (•*) - Х 2 И = [Фі (•*) + Фі (*)] - [ф 2 {х) + Ф 2 (*)] = 

= [фі(*) — ф 2 (*)] + [Фі(*) — Ф 2 (-*)] ( 4 ) 

также нацело делится на многочлен / (лг). Это же верно и для 
разности Ѳ^х) — Ѳ 2 (х), так как 

Ѳі (х) — Ѳ 2 (X) = ф х (х) фі (х) — «р 2 (х) хр 2 (х) = 

= Фі (х) Фі (X) — ф х (х) ф 2 (х) 4- ф х (х) ф 2 (х) — ф 2 (х) ф 2 (х) = 

== Фі (*) [Фі (х) - ф 2 (X)] + [фі (х) - ф 2 (х)] ф 2 (х). (5) 

Равенство (4) показывает, что многочлены (х) и % 2 (х) лежат 
в одном классе. Иными словами, сумма любого многочлена из класса А 
с любым многочленом из класса В принадлежит ко вполне опреде- 
ленному классу С, который не зависит от того, какие именно много- 
члены выбраны в качестве «представителей» в классах А и В; 
назовем этот класс С суммой классов А и В: 

С=А + В. 

Аналогично, ввиду (5), не зависит от выбора представителей 
в классах А и В и тот класс О, в котором лежит произведение 
любого многочлена из А на любой многочлен из В; этот класс 
назовем произведением классов А и б: 

Я=АЯ. 

Покажем, что совокупность классов, на которые разбито нами 
кольцо многочленов Р [х], после указанного введения операций сло- 
жения и умножения превращается в поле. В самом деле, справедли- 
вость законов ассоциативности и коммутативности 
для обеих операций и закона дистрибутивности вытекает 
из справедливости этих законов в кольце Р(х], так как операции 
над классами сводятся на операции над многочленами, лежащими 
в этих классах. Роль нуля играет, очевидно, класс, составленный 
из многочленов, нацело делящихся на многочлен /(х). Этот класс 
назовем нулевым и будем обозначать символом 0. Противо- 
положным для класса А, составленного из многочленов, дающих 
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при делении на /(х) остаток ф (лг), будет служить класс, составлен- 
ный из многочленов, дающих при делении на /( х ) остаток — ф(х). 
Отсюда вытекает, что в множестве классов выполнимо однознач- 
ное вычитание. 

Для доказательства того, что в множестве классов выполнимо 
деление, нужно показать, что существует класс, играющий роль 
единицы, и что для всякого класса, отличного от нулевого, суще- 
ствует обратный класс. Единицей будет, очевидно, класс много- 
членов, дающих при делении на /(х) остаток 1; этот класс назовем 
единичным и будем обозначать символом Е. 

Пусть теперь дан класс А, отличный от нулевого. Многочлен ф (х), 
выбранный в классе А в качестве представителя, не будет, следователь- 
но, нацело делиться на /(х), и поэтому, ввиду неприводимости 
многочлена /(х), эти два многочлена взаимно просты. В кольце Я[х] 
существуют, таким образом, многочлены п(х) и ѵ{х), удовлетворяю- 
щие равенству 

ф(х)и(х)4-/(х)г/(х)=1, 

откуда 

ф (х) и (х) = 1 — / (лг) ѵ (х) . (6) 

Правая часть равенства (6) при делении на /(х) дает в остатке 1, 
т. е. принадлежит к единичному классу Е. Если класс, к которому 
принадлежит многочлен и(х), мы обозначим через В, то равенство (6) 
показывает, что 

АВ = Е, 

откуда В — А~ 1 . Этим доказано существование обратного класса 
для всякого ненулевого класса, т. е. закончено доказательство того, 
что классы составляют поле. 

Обозначим это поле через Р и покажем, что оно является рас- 
ширением поля Р. Всякому элементу а поля Р соответствует класс, 
составленный из многочленов, дающих при делении на /( х ) оста- 
ток а; сам элемент а , рассматриваемый как многочлен нулевой 
степени, принадлежит к этому классу. Все классы этого специального 
вида составляют в поле Р подполе, изоморфное полю Р. Действи- 
тельно, взаимная однозначность соответствия очевидна; с другой 
стороны, в этих классах можно выбрать в качестве представителей 
элементы поля Я, а поэтому сумме (произведению) элементов из Я 
будет соответствовать сумма (произведение) соответствующих клас- 
сов. В дальнейшем мы имеем право, следовательно, не различать 
элементы поля Я и соответствующие им классы. 

Обозначим, наконец, через X класс, составленный из многочленов, 
дающих при делении на /(х) остаток х. Этот класс является вполне 
определенным элементом поля Я, и мы хотим показать, что он 
служит корнем для многочлена /(х). Пусть 

/(х) = а 0 х п а 1 х п ~ 1 . . . 4 «„_ х х + а„. 
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Обозначим через А і класс, соответствующий в указанном выше 
смысле элементу а і поля Р, і — 0, 1, ... , п, и найдем, чему равен 
элемент 

А^Х п Аг А х Х п ~ 1 -\- , . . А п _ 1 Х-\- А п (?) 

поля Р. Считая представителями классов А { элементна,., / = 0,1, . . .,«, 
а представителем класса X — многочлен х и используя определение 
сложения и умножения классов, мы получаем, что в классе (7) со- 
держится сам многочлен /(х). Однако /( х ) нацело делится на самого 
себя, и поэтому класс (7) оказывается нулевым. Таким образом, за- 
меняя в (7) классы А і соответствующими им элементами а і поля Р, 
мы получаем, что в поле Р имеет место равенство 

О-ьХ* + а 1 Х п ~ 1 + . . . + а п - і^Н~ а п ~ 0> 

т. е. класс X действительно является корнем многочлена /( х ). 

Этим заканчивается доказательство теоремы о существовании 
корня. Заметим, что, взяв за Р пола действительных 
чисел и положив / (х)—х і -\-\, мы получим еще один 
способ построения поля комплексных чисел. 

Из теоремы о существовании корня могут быть выведены след- 
ствия, аналогичные тем, которые выводились в § 24 из основной 
теоремы алгебры комплексных чисел. Сначала сделаем одно замеча- 
ние. Так как всякий линейный множитель х — с многочлена /(. к ) 
неприводим, то он должен входить в то е д и н с т в е н н о е разло- 
жение на неприводимые множители, которым обладает /( х ). 

Число линейных множителей в разложении /{х) на неприводимые 
множители не может превосходить, однако, степени этого много- 
члена. Мы приходим к следующему результату: 

Многочлен /(х) степени п может иметь в поле Р не более п 
корней, если даже каждый из корней считать столько раз, 
какова его кратность. 

Назовем полем разложения для многочлена /(л*) степени п над 
полем Р такое расширение <3 поля Р, в котором для /(х) содер- 
жится п корней (считая кратные корни столько раз, какова их 
кратность). Над полем С} многочлен /{х) будет раскладываться, 
следовательно, на линейные множители, причем никакое дальнейшее 
расширение поля (2 уже не может привести к появлению новых кор- 
ней для /(х). 

Для всякого многочлена /(х) из кольца Р\х ] существует над 
полем Р поле разложения. 

В самом деле, если многочлен /(х) степени п, я5г1, имеет 
п корней в самом поле Р, то Р будет искомым полем разложения. 
Если же /(х) не разлагается над Р на линейные множители, то 
берем один из его нелинейных неприводимых множителей ц>{х) и, 
на основании теоремы о существовании корня, расширяем Р до 
поля Р', содержащего корень для ф(лг). Если над Р' многочлен /(х) 
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все еще не разлагается на линейные множители, то снова расширяем 
поле, создавая корень еще для одного из оставшихся нелинейных 
неприводимых множителей. После конечного числа шагов мы придем, 
очевидно, к полю разложения для /( х ). 

Понятно, что /(х) может обладать многими различными полями 
разложения. Можно было бы доказать, что все минимальные поля, 
содержащие поле Р и п корней многочлена /(х) (где п — степень 
этого многочлена), изоморфны между собой. Мы не будем, однако, 
использовать этого утверждения и поэтому не приводим его дока- 
зательства. 

Кратные корни. В предшествующем параграфе было доказано, 
что многочлен /( х ) над полем Р характеристики 0 тогда и только 
тогда не имеет кратных множителей, если он взаимно прост со своей 
производной, а также было отмечено, что отсутствие у /(х) крат- 
ных множителей над Р влечет за собой отсутствие таких множителей 
над любым расширением Р поля Р. Применяя это к случаю когда/* 
есть некоторое поле разложения для /(х), и вспоминая определение 
кратного корня, мы приходим к следующему результату: 

Если многочлен /(х) над полем Р характеристики 0 не имеет 
кратных корней в данном поле разложения, то он взаимно 
прост со своей производной /' (х). Обратно, если /(х) взаимно 
прост со своей производной, то он не имеет кратных корней 
ни в каком из своих полей разложения. 

Отсюда, в частности, вытекает, что многочлен /(х), неприводи- 
мый над полем Р характеристики 0, не может иметь кратных 
корней ни в каком расширении этого поля. Для полей конечной 
характеристики это утверждение перестает быть справедливым — 
обстоятельство, играющее заметную роль в общей теории полей. 

В заключение заметим, что для случая произвольного поля со- 
храняются и формулы. Вьета (см. § 24); при этом корни много- 
члена берутся в некотором поле разложения этого многочлена. 


§ 50*. Поле рациональных дробей 

Теория рациональных дробей, изложенная в § 25, полностью 
сохраняется и в случае произвольного основного поля. Однако 
при переходе от поля действительных чисел к произвольному полю Р 
Нх) . 

взгляд на выражения как на функции переменного х дол- 

§ (х) 

жен быть отброшен, так как он, как мы знаем, неприменим уже 
к многочленам. Перед нами стоит задача определить, какой смысл 
нужно придать этим выражениям в том случае, когда коэффициенты 
принадлежат к произвольному полю Р. Точнее, мы хотим построить 
поле, в котором содержалось бы кольцо многочленов Р[х], при- 
чем так, чтобы операции сложения и умножения, определенные 
в этом новом поле, в применении к многочленам совпадали бы 
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с операциями в кольце Р\х}\ короче, кольцо Р[х] должно быть п од- 
кол ьцом этого нового поля. С другой стороны, всякий элемент 
этого нового поля должен представляться (в смысле деления, опре- 
деленного в этом поле) в виде частного двух многочленов. Такое 
поле для всякого Р может быть построено, как будет сейчас пока- 
зано; его обозначают Р(х) (неизвестное заключено в круглые скобки!) 
и называют полем рациональных дробей над полем Р. 

Предположим сначала, что кольцо Р[х] уже является подкольцом 
некоторого поля С}. Если /(х) и %(х ) — произвольные многочлены 
из Р [х]/ причем § (х) 0, то в поле (3 существует однозначно опре- 

деленный элемент, равный частному от деления /(х) на %{х). Обо- 


I (х) 

значая этот элемент, как обычно в случае поля, через мы на 
основании определения частного можем написать равенство 


/(х)=ё(х)Ш’ (1) 

где произведение нужно понимать в смысле умножения в поле <3. 
Может случиться, что некоторые частные и являются 

одним и тем же элементом поля (3; условием для этого является 
обычное условие равенства дробей: 


Тогда и только тогда , если /(х) ф(х) = <р (х) §(х). 

Действительно, если то, по (1), 

8(х) Ф(*) ' 7 


/{х)=8 (х) а, ер (х) = ф (х) а, 

откуда 

/(х) ф (X) = ф (х) ф (х) а = ^ (х) ф (х). 


Обратно, если /(х) ф (х)=^(х) ф [х) = и (х) в смысле умножения 
в кольце Р [х], то, переходя к полю С ?, мы получаем равенства 

!(х ) _ ц (х) _фМ 
ё(х ) ё(х)'ф(х) Ф (х) ' 

Легко видеть, далее, что сумма и произведение любых элементов 
из 0 , являющихся частными многочленов из Р[х], снова могут быть 
представлены в виде таких частных, причем справедливы обычные 
правила сложения и умножения дробей: 


!(*) 

, ф (х) І (X) ф (х) + § (х) ф (х) 

(2) 

ё(х) 

1 ф<*) 

8 (х) ф (X) ’ 


{ (X) фѵ(*) _ 

Я (х) ф (х) 

_/(■*)• ф (*) 
гМ'ФМ ' 

(3) 


Действительно, умножая обе части каждого из этих равенств на 
произведение ^(х)ф(х) и применяя (1), мы получим равенства, 
справедливые в кольце Р[х]. Справедливость равенств (2) и (3) 
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следует теперь из того, что, благодаря отсутствию делителей нуля 
в поле С }, обе части каждого из полученных равенств можно сокра- 
тить на отличный от нуля элемент § (х) ф (х), не нарушая равенств. 

Эти предварительные замечания подсказывают нам тот путь, по 
которому мы должны пойти при построении поля Р(х). Пусть даны 
произвольное поле Р и над ним кольцо многочленов Р[х\. Всякой 
упорядоченной паре многочленов /(х), §фх), где ^{х)ф0, мы ста- 


вим в соответствие символ 


/ (*) 
й(хѴ 


называемый рациональной дробью 


с числителем /(х) и знаменателем ^г(х). Подчеркиваем, что это 
просто символ, соответствующий данной паре многочленов, так как 
деление многочленов в самом кольце Р[х\, вообще говоря, невы- 
полнимо, а ни в каком поле кольцо Р[х] пока еще не содержится; 

если даже @(х) является делителем для /(х), новый символ 

В (х) 

следует пока отличать от многочлена, получающегося в качестве 
частного при делении /(х) на ^(х). 


Назовем теперь рациональные дроби 


/(*) 

8(х) 


ф(х) 

Ф(х) 


равными : 


/ (*) Ф (х) 

В (х) Ф (х) ’ 


если в кольце Р[х ] имеет место равенство /(х) -ф (х)=§{х) ф (х). 
Очевидно, что всякая дробь равна самой себе, а также, что если 
одна дробь равна другой, то и вторая равна первой. Докажем 
транзитивность этого понятия равенства. Пусть даны равен- 
ства (4) и 

Ф(х)__«]х) 

Ф (х) ѵ (х) * ѵ ' 


Из равносильных им равенств в кольце Р\х\ 

/(х) ф (х) = § (х) ф (х), Ф (х) т> (х) = ф (х) и (х) 


вытекает 

/ (х) ѵ (х) ф (х) = § (х) ф (х) ѵ (х) = § (х) и (х) ф (х) 

и поэтому, после сокращения на не равный нулю (как знаменатель 
одной из дробей) многочлен ф(х), получаем: 

/(х) ѵ (х) —к(х) и (х), 

откуда, по определению равенства дробей, 

I (*) _ и (х) 

В (х) ѵ {х) ’ 

что и требовалось доказать. 

Объединим теперь в один класс все дроби, равные некоторой 
данной, и поэтому, в силу транзитивное™ равенства, равные между 
собой. Если в одном классе имеется хотя бы одна дробь, не 
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содержащаяся в другом классе, то, как следует из транзитивности 
равенства, эти два класса не имеют ни одного общего элемента. 

Таким образом, совокупность всех рациональных дробей, напи- 
санных при помощи многочленов из кольца Р[а], распадается на 
непересекающиеся классы равных между собой дробей. Мы хотим 
теперь так определить алгебраические операции в этом множестве 
классов равных дробей, чтобы оно оказалось полем. Для этого 
мы будем определять операции над рациональными дробями и 
каждый раз проверять, что замена слагаемых (или множителей) 
равными им дробями заменяет сумму (или произведение) также рав- 
ной дробью. Это позволит говорить о сумме и произведении клас- 
сов равных дробей. 

Предварительно сделаем следующее замечание, которое дальше 
будет неоднократно применяться: рациональная дробь превращается 
в равную дробь, если ее числитель и знаменатель умножаются 
на один и тот же многочлен, отличный от нуля, или же со- 
кращаются на любой общий множитель. Действительно, 

! (*) ! (*) Ь (*) 

§(х) ё(х)Цх)' 

так как в кольце Р[а] 

/(*) Ы (*) А (а)] = $ (х) [/(*) Н (а-)]. 

Сложение рациональных дробей мы определяем по формуле (2); 
так как из ^(л:)^=0 и ф(А)=й=0 следует §(х) ф (х) ф 0, то правая 
часть этой формулы действительно будет рациональной дробью. 
Если дано, далее, что 

/(*)■_ Іо ( х ) ф (х) _ (х) 

8 (х) во(х ) ’ ф ( х ) ф 0 (х) ’ 

т. е. 

/(х)§о(х)=§(х)/ 0 (х), ф (х) фо (а) = ф (а) фо (а-), (6) 

то, умножая обе части первого из равенств (6) на ф (а) ф 0 (а), обе 
части второго равенства — на §(х)іо(х), а затем складывая эти 
равенства почленно, мы получим: 

[/ (А) ф (А) + 2 (А) ф (А)] §0 (А) фо (А) = 

= І/о {х) Фо {х) + іо {х) фо (*)] § (а) ф (а), 

что равносильно равенству 

І(х)Ѵ (х)+§(х) у (а) _ /о (а) Фо (х) + д 0 (а) ф 0 (а) 

8 (х) Ф (х) § 0 (х) ф„ (х) 

Таким образом, если даны два класса равных между собой дро- 
бей, то суммы любой дроби из одного класса с любой дробью из 
другого класса все между собой равны, т. е. лежат в некотором 
вполне определенном третьем классе. Этот класс называется суммой 
заданных двух классов. 
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Коммутативность этого сложения непосредственно вытекает 
из (2), а а с с о ц и а т и в н о с т ь доказывается следующим образок: 


7 (х) . ф (х)1 , и (х) = _ ( (х)ф (х) + ^(х) ф (х) и(х)__ 

.8 (х) ф (а ) ] ѵ (х) § (х) ф (х) _г ѵ (х) 

_ ! (х) Ф (х) V (х) + 1 (х) ф (х) V (X) + 8 (х) Ф (■'■) и (а) 


8 (х) Ф (х) ѵ (х) 

Их) , ф (х)ц(х) + ф (х) и (х) _ Их) . Г ф (х) , и (а) 
8 (а) ф (а) ѵ (х) $ (х) ~ г ' [ф (а) " г ѵ ( х ) 


Из определения равенства дробей без труда следует, что все 
дроби вида , т. е. дроби с равным нулю числителем, равны 

между собой и что они составляют полный класс равных дробей. 
Этот класс мы назовем нулевым и докажем, что он играет в на- 
шем сложении роль нуля. Действительно, если дана произвольная 

дробь 7-7^1, то 
Ф (а) 

О , Ф(а) _ 0-ф (а) + ^(а) ф (х) _ 8 (а) Ф (а) __ ф (а) 

8 (х) ф (а) 8 (а) ф (а) е (а) ф (а) ф (а) ‘ 


Из равенства 


Их) -Пх) 0 
8 (А) 8 (а) 8 2 (А) ’ 


правая часть которого принадлежит к нулевому классу, следует 
теперь, что класс дробей, равных дроби — , бу дет противопо- 

ложным для класса дробей, равных дроби Отсюда, как мы 

знаем, следует выполнимость однозначного вычитания. 

У множение рациональных дробей мы определим по формуле (3), 
причем, ввиду ф (х) ф (х)=^=0, правая часть этой формулы действи- 
тельно будет рациональной дробью. Если, далее, 

ИХ) _ !о (А) ф (А) _ фо (а) 

’ Фо (А) ’ 


т. е. 


/(х)§о(х) = §(х)/о(х). 


8 (А) Во (а) ’ Ф (а) 

ф (х) фо (х) = ф (X) фо (х), 


то, перемножая эти последние равенства почленно, мы получим: 

/ (х) (х) ф (х) фо (х) = ^ (х) /о (х) ф (X) фо (х), 

что равносильно равенству 

/ (а) ф (а) _ ! 0 (а) фо (а) 

?(а)Ф(а) §0 (а) фо (а) ' 

Таким образом, по аналогии с данным выше определением суммы 
классов, можно говорить о произведении классов равных между 
собой дробей. 
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Коммутативность и ассоциативность этого умноже- 
ния непосредственно следуют из (3), а справедливость закона 
дистрибутивности доказывается следующим образом: 

Г Их) , ф(*) ~1 и(х) _ [ ( х ) ф (х) + (У ( х ) ф (х) _ и_(х) _ 
и (х) , ф (*)] ѵ (х) и (*) Ф (х) ' ѵ (х) 

_ [/ (X) ф (х) + ё (*) Ф (х)] и (х) __ I (х) ф (,ѵ) и (.у) + 8 ( х ) у (х) и (х) _ 
ё (х) ф (х) V (X) ц (X) ф (х) V (X) 

/МФ (х) и (х) ѵ (х)~<у(х) Ф (х) и (х) ѵ(х) _^ і ( х ) и (х) , ф (х) и (х) _ 
ё (*) Ф (*) у 3 (•»-') ё (х) ѵ(х) 1 ф (х) V (X) 

_/(х) и(х) ф(х) и (х) 
ё(х) ' ѵ (х) ' ф (х) ' ѵ(х) ' 


Легко видеть, что дроби вида т. е. дроби, числитель 

которых равен знаменателю, все равны между собой и составляют 
отдельный класс. Этот класс называется единичным и играет в на- 
шем умножении роль единицы: 

!(х) . ф_(*) І(х) Ф (х) ^ ф (х) 

Их) ‘ Гр (X) ! (х) ф (х) ф (*) • 


Если, наконец, дробь ^ не принадлежит к нулевому классу, 

т. е. то существует дробь . Так как 

I \Х) 

Их) _ ё(х) _ ! (х) ё (х) 
е(х)’ I (X) 8 (х) I (х) ' 


а правая часть этого равенства принадлежит к единичному классу, 

то класс дробей, равных дроби гу-І , будет обратным для класса 

Г I*) 

I іх) 

дробей, равных дроби . Отсюда следует выполнимость одно- 
значного деления. - 

Таким образом, классы равных между собой рациональных 
дробей с коэффициентами из поля Р составляют при нашем 
определении операций коммутативное поле. Это поле . и будет 
искомым полем Р(х). Мы должны еще, впрочем, доказать, что 
в построенном нами поле содержится подкольцо, изоморфное 
кольцу Р{х], и что всякий элемент поля представим в виде част- 
ного двух элементов из этого подкольца. 

Если мы произвольному многочлену /( х ) из кольца Р [х] поста- 

/ (^) 

вим в соответствие класс рациональных дробей, равных дроби '-у-с 

(среди всех дробей содержатся, понятно, и дроби, знаменатель ко- 
торых равен единице), то получим взаимно однозначное отображение 
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кольца Р\х] внутрь построенного нами поля. Действительно, из 
равенства 


/ (*) _ ф (х) 
1 ~ 1 


следовало бы / (ж) • 1 = 1 -ф (х), т. е. /(х) = (р (х). Это отображе- 
ние будет даже изоморфным, как показывают равенства 

Их) , ё(х ) __ /(*)•! +&(*)•! _ !(х)+§(х) 

1 ^ 1 ~ і 2 1 


/(*) 8(х)_ Нх)-Я(х) 
1 ' 1 ~ 1 


/ (х) 

Таким образом, классы дробей, равных дробям вида , со- 
ставляют в нашем поле подкольцо, изоморфное кольцу Р[х]. 
Дробь можно поэтому обозначить просто /(х). Так как, нако- 

нец, при §(х)^0 класс дробей, равных дроби — -Ц , является об- 

ё \Х) 

ратным для класса дробей, равных дроби ^-р, то из равенства 

Их) 1 _ Их) 

1 ё(х) ё ( х ) 


следует, что все элементы нашего поля можно считать (в смысле 
операций, определенных в этом поле) частными многочленов из 
кольца Р[х). 

Мы построили над произвольным полем Р поле рациональных 
дробей Р(х). Этим же методом, беря вместо кольца многочленов 
кольцо целых чисел, можно построить поле рациональных чисел. 
Объединяя эти два случая и используя такой же метод, можно 
было бы доказать теорему, что вообще всякое коммутативное кольцо 
без делителей нуля является подкольцом некоторого поля. 



ГЛАВА ОДИННАДЦАТАЯ 

МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 


§ 51. Кольцо многочленов от нескольких неизвестных 

Нередко приходится рассматривать многочлены, зависящие не от 
одного, а от двух, трех, вообще от нескольких неизвестных. Так, 
в первых главах книги нами уже изучались линейные и квадратичные 
формы, представляющие собой примеры таких многочленов. Вообще 
многочленом /(х ѵ х 2 , .... х п ) от п неизвестных х ѵ х 2 , ...,х п над 
некоторым полем Р называется сумма конечного числа членов вида 
Хі'х к г 2 ... х кп , где все к і > 0, с коэффициентами из поля Р; при этом 
предполагается, понятно, что многочлен /(х ѵ х 2 , . . . , х п ) не содержит 
подобных членов и что рассматриваются лишь члены с отличными от 
нуля коэффициентами. Два многочлена от п неизвестных, /(л;,, х 2 , ..., 
л„) и^(лг„ х 2 , . . .,*„), считаются равными (или тождественно равны- 
ми), если равны их коэффициенты при одинаковых членах. 

Если дан многочлен /(х ѵ х 2 , . . ., х п ) над полем Р, то его сте- 
пенью по отношению к неизвестному х { , і— 1,2, . . ., п, называется 
наивысший показатель, с каким входит х і в члены этого многочлена. 
Случайно эта степень может быть равной 0, что означает, что хотя / 
считается многочленом от п неизвестных х ѵ х 2 , . . ., х ь . . ., х п , но 
неизвестное х { на самом деле в его запись не входит. 

С другой стороны, если мы назовем степенью члена 


число к х + к г + . . . + т. е. сумму показа телей при неизвестных, то 
степенью многочлена /(х ѵ х 2 , ...,х„) (т. е. степенью по сово- 
купности неизвестных) будет наивысшая из степеней его чле- 
нов. В частности, многочленами нулевой степени будут, как и в случае 
одного неизвестного, лишь отличные от нуля элементы из поля Р. 
С другой стороны, как и в случае многочленов от одного неизвестного, 
нуль будет единственным многочленом от п неизвестных, степень 
которого не определена. Понятно, что многочлен в общем случае 
может содержать несколько членов наивысшей степени и поэтому 
нельзя говорить о старшем (по степени) члене многочлена. 
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Для многочленов от п неизвестных над полем Р следующим обра- 
зом определяются операции сложения и умножения. Суммой много- 
членов /(х ѵ х 2 , . . ., х п ) и %{х ѵ х 2> • - х п ) называется многочлен, 
коэффициенты которого получаются сложением соответственных 
коэффициентов многочленов / и если при этом некоторый член 
входит лишь в один из многочленов /, то коэффициент при нем 
в другом многочлене считается, понятно, равным нулю. Произведение 
двух «одночленов» определяется следующим равенством: 


ах\'х\\. .Хп п -Ьх‘ 1 'хі\ . .х‘ п п = (аЬ) х\' +1 'х\^ 1 ' . . .хУ 1п , 


после чего произведение многочленов /(*„ х 2 , ..., х п ) и ^(л:,, х % , ..., х п ) 
определяется как результат почленного перемножения и последующего 
приведения подобных членов. 

При таком определении операций совокупность многочленов 
от п неизвестных над полем Р превращается в коммутативное 
кольцо, причем это кольцо не содержит делителей нуля. В самом 
деле, при п — 1 наши определения совпадают с теми, которые были 
даны в § 20 для случая многочленов от одного неизвестного. Пусть 
уже доказано, что многочлены от л — 1 неизвестных л:,, лг 2 , . . . , х п _ г 
с коэффициентами из поля Р составляют кольцо без делителей нуля. 
Всякий многочлен от п неизвестных х ѵ х 2 , ...,х п _ ѵ х п можно 
представить, притом единственным способом, как многочлен от неиз- 
вестного х п с коэффициентами, являющимися многочленами от х х , 
х 2 , ...,х п _ 1 ' обратно, всякий многочлен от х п с коэффициентами 
из кольца многочленов от х ѵ х 2 , ...,х„_, над полем Р можно 
рассматривать, конечно, как многочлен над этим же полем Р 3 от 
всей совокупности неизвестных х ѵ х 2 , ...,х п _ ѵ х п . Без труда 
проверяется, что полученное нами взаимно однозначное соответствие 
между многочленами от п неизвестных и многочленами о,т одного 
неизвестного надкольцом многочленов от л — 1 неизвестных является 
изоморфным по отношению к операциям сложения и умножения. 
Доказываемое утверждение вытекает теперь из того, что многочлены 
от одного неизвестного над кольцом многочленов от л — 1 неиз- 
вестных сами составляют кольцо, причем оно как кольцо многочле- 
нов от одного неизвестного над кольцом без делителей нуля само 
не содержит делителей нуля (см. § 47). 

Мы доказали, следовательно, существование кольца многочленов 
от п неизвестных над полем Р; это кольцо обозначается симво- 
лом Р[х ѵ лг 2 , . . ., х п ). 

Следующие рассмотрения позволяют посмотреть на кольцо много- 
членов от п неизвестных с несколько иной точки зрения. Пусть 
поле Р содержится в некотором коммутативном кольце і в качестве 
подкольца. Возьмем в Ь п элементов а,, а 2 , . . . , а п и найдем мини- 
мальное подкольцо V кольца 7, содержащее эти элементы и все 
поле Р, т. е. подкольцо, получающееся в результате присоединения 
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к полю Р элементов а,, а 2 , .... а п . Подкольцо А' состоит из всех 
элементов кольца А, которые выражаются через элементы о,, а а п 
и элементы поля Р при помощи сложения, вычитания и умножения. 
Легко видеть, что это будут в точности те элементы кольца А, 
которые можно записать (при помощи операций, имеющих место в А) 
в виде многочленов от а 2 , с коэффициентами из Р, 

причем эти элементы будут как элементы кольца А между собой 
складываться и умножаться как раз по указанным выше правилам 
сложения и умножения многочленов от п неизвестных. 

Конечно, данный элемент р из подкольца А' будет, вообще говоря, 
обладать многими различными записями в виде многочлена от а ѵ 
Й 2 , . . ., а п с коэффициентами из поля Р. Если для всякого р из V 
такая запись однозначна, т. е. если различные многочлены от 
а х , а 2 , ...,а„ будут различными элементами кольца А' (и, следо- 
вательно, кольца А), то система элементов а ъ а 2 , . . . , а п называется 
алгебраически независимой над полем Р, в противном случае — 
алгебраически зависимой' 1 ). Отсюда можно вывести такое заключение - . 

Если поле Р является побкольцом коммутативного кольца А 
и если система элементов а. 1 , а 2 , . . ., а„ из А алгебраически не- 
зависима над Р, то подкольцо А' кольца А, порождаемое при- 
соединением к полю Р элементов а 1 , а 2 , ...,сс п , изоморфно 
кольцу многочленов Р[х 1 ,х і , ...,х п ]. 

Из других свойств кольца многочленов от п неизвестных 
Р[х 1 ,х : 2 , . . , , х п ] укажем на следующее: это кольцо можно вклю- 
чить в поле рациональных дробей Р (х х , х 2 , ... , х п ) от п неиз- 
вестных над полем Р. Всякий элемент этого поля может быть 

записан в виде — ,где/и§' — многочлены из кольца Р[х г , х 2 , ..., _г п ], 


причем тогда и только тогда если /ф = ,{гф. Сложение и 

умножение этих рациональных дробей производятся по правилам, 
которые, как было указано в § 45, справедливы для частных во 
всяком поле. Доказательство существования поля Р (х г , х 2 , . . ., х п ) 
проводится так же, как это делалось в § 50 для случая п= 1. 


Для многочленов от нескольких неизвестных можно построить теорию 
делимости, обобщающую ту теорию делимости для многочленов от одного 
неизвестного, которую мы изучали в гл. 5 и 10. Так как, однако, детальное 
изучение кольца многочленов от нескольких неизвестных не входит в наши 
задачи, то мы ограничимся только вопросом о разложении многочлена на 
неприводимые множители. 

Введем сначала следующее понятие: если все члены многочлена 
/(*!, х 2 , ..., х п ) имеют одну и ту же степень 5 , то такой многочлен назы- 
вается однородным многочленом или, короче, формой 5-й степени; нам 


х ) Соответствующие понятия для случая п= 1 были уже введены в § 47: 
элемент а, алгебраически независимый над полем Р в смысле только что 
данного определения, был назван там трансцендентным над А, в 
противном случае — а лгебранческим над Р. 
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уже известны линейные и квадратичные формы, можно рассматривать, 
далее, кубичные формы, все члены которых имеют по совокупности неиз- 
вестных степень 3, и т. д. Всякий многочлен от л неизвестных 
однозначно представим в виде суммы нескольких форм 
от этих неизвестных, притом имеющих разные степени: 
достаточно объединить вместе все члены, имеющие одну и ту же степень, 
чтобы получить искомое представление. Так, многочлен четвертой степени 
І (х ѵ х 2 , — — 7х\ х\+х 2 — Бх^Хз+х* — 2х 3 — 6 + Х 3 будет суммой 

формы четвертой степени х * — ? Х 1 Х 1> кубичной формы Зх х х 2 — 5х 1 х 2 х і -{- 
+ линейной формы х 2 — 2 х 3 и свободного члена (формы нулевой степе- 
ни) — 6 . 

Докажем теперь следующую теорему: 

Степень произведения двух отличных от нуля многочленов от п неиз- 
вестных равна сумме степеней этих многочленов. 

Предположим . сначала, что нам даны формы ср (х х . х 2 , ...,х п ) сте- 
пени 5 и ф(хх, х 2 , .... х„) степени і. Произведение любого члена формы ср 
на любой ' член формы ф будет, очевидно, иметь степень *-)-/, а потому 
произведение фф будет формой степени я 1 , так как приведение подобных 
членов не может сделать все коэффициенты этого произведения равными 
нулю ввиду отсутствия в кольце Р [х,, х 2 , х п ] делителей нуля. 

Если теперь даны произвольные многочлены ) (х х . х 2 , ... , х п ) и 

§■(*!, дг 2 х п ) соответственно степеней з и I, то, представляя каждый из 

них в виде суммы форм разных степеней, мы получим: 

ІА* і. *г * п ) = <Р(*і. х 

8 (*і, х 2 х„) = ф (х ѵ х 2 , . . . , х„) + . . . , 

где ф и ф будут соответственно формами степеней я и I, а многоточия 
заменяют суммы форм меньших степеней. Тогда 

Ы = фФ + ---; 

форма фф имеет, по доказанному, степень 5 + ^, а так как все члены, заме- 
ненные многоточием, имеют меньшую степень, то степень произведения [д 
будет раина я -\-і' Теорема доказана. 

Многочлен ф называется делителем многочлена }, а / — делящимся 
на ф, если в кольце Р [х х , х 2 , существует такой многочлен ф, что 

^ = фф. Легко видеть, что свойства делимости I — IX из § 21 сохраняются и 
в рассматриваемом сейчас общем случае. Многочлен ( степени к, й Зг 1, на- 
зывается приводимым над полем Р, если он разлагается в произведение 
многочленов из кольца Р [х х , х 2 . ...,х ц ], степени которых меньше к, и 
неприводимым — в противоположном случае. 

Всякий многочлен из кольца Р [х 1 , х 2 х„], имеющий степень, 

отличную от нуля, разлагается в произведение неприводимых множи- 
телей. Это разложение однозначно с точностью до множителей нуле- 
вой степени. 

Эта теорема обобщает соответствующие результаты из § 48, относящиеся 
к многочленам от одного неизвестного. Ее первое утверждение доказывается 
дословным повторением рассуждений из указанного параграфа. Доказатель- 
ство второго утверждения представляет уже значительные трудности. Прежде 
чем проводить его, мы заметим, что из второго утверждения этой теоремы 
вытекает такое следствие: если произведение двух многочленов I и § из 

кольца Р [х ѵ х 2 х п ] делится на неприводимый многочлен р, то хотя 

бы один из этих многочленов делится на р. Действительно, в противном 
случае мы получили бы для произведения два разложения на неприво- 
димые множители, одно из которых р не содержит, а другое содержит. 
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Пусть теорема уже доказана для многочленов от я неизвестных, и мы 
хотим доказать ее для многочлена от я+1 неизвестных х, х г , х 2 , .... х п . 
Запишем этот многочлен в виде <р (х); его коэффициенты будут, следова- 
тельно, многочленами от х ѵ х 2 , . . ., х п . Для этих коэффициентов теорема уже 
доказана, т. е. каждый из них однозначно разлагается в произведение не- 
приводимых множителей. Назовем многочлен <р (х) примитивным (точнее, 
примитивным над кольцом Р [х ѵ х 2 , если его коэффициенты не 

содержат ни одного общего неприводимого множителя, т. е. в совокупности 
взаимно просты, и докажем следующую лемму Гаусса: 

Произведение двух примитивных многочленов само есть примитивный 
многочлен. 

В самом деле, пусть даны примитивные многочлены 

I (х) = а 0 х к + а у х к “Ч-...+ аУ + а к , 

ё ( х ) = ЬУ + Ьу- 1 + . . . + Ьу~і+ ... +Ь ( 

с коэффициентами из кольца Р [х ѵ х 2 , ..., х п ] и пусть 

!. О х)8 (х) = с а х к + 1 -\-сУ +1 ~ 1 + . . . +с і+/ х к+1 -(‘ +;) + . . . +с к+1 . 

Если это произведение не примитивно, то коэффициенты с 0 , с х с к+1 

будут обладать общим неприводимым множителем р = р(х 1 ,х 2 , ... , х п ). 
Так как все коэффициенты примитивного многочлена I (х) не могут делиться 
на р, то пусть коэффициент а,- будет первым, на р не делящимся; анало- 
гично через Ь] мы обозначим первый коэффициент многочлена §(х), не 
делящийся на р. Перемножая почленно Цх) и §(х) и собирая члены, со- 
держащие х к+1 ~ и +- / \ мы получим: 

с і +/ — а і^і т а і - іЬ /+ і + - 2*/ь 2 л • • • + а і+і^/_і + а! + 2*/_г+ • • • 

Левая часть этого равенства делится на неприводимый многочлен р. На него 
заведомо делятся также все слагаемые правой части, кроме первого; дей- 
ствительно, ввиду условий, наложенных на выбор і и /, все коэффициенты 

а,-_і, а также Ь]_ 2 , ... делятся на р. Отсюда следует, что 

произведение а, 6,- также делится на р, а поэтому, как отмечено выше, на р 
должен делиться хотя бы один из многочленов а,-, Ь/, что, однако, не имеет 
места. Этим заканчивается доказательство леммы в предположении справед- 
ливости основной теоремы для многочленов от п неизвестных. 

Кольцо Р [х ѵ х 2 , ...,*„] содержится, как мы знаем, в поле рацио- 
нальных дробей Р (х 4 , х 2 х п ), которое мы обозначим через ф: 

<?=?(*!, Х 2 . .... Х„). 

Рассмотрим кольцо многочленов <3 [х]. Если многочлен ф (х) принадлежит 
к этому кольцу, то каждый его коэффициент представим в виде частного 
многочленов из кольца Р [х г , х 2 , Вынося за скобки общий знаме- 

натель этих частных, а затем и общие множители из числителей, можно 
представить ф (х) в виде 

Ф (*) = у (. (*>• 

Здесь а и Ь являются многочленами из кольца Р [х 1г х 2 , . . , , х„], а 1(х) — 

многочленом от х с коэффициентами из Р [х х , х 2 х п ], причем даже 

примитивным многочленом, так как его коэффициенты уже не имеют общих 
множителей. 

Этим путем всякому многочлену ф ( х ) из кольца <2 [х] поставлен в соот- 
ветствие примитивный многочлен і : (х). Для данного ф (х) многочлен I (х) 
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определен однозначно с точностью до отличного от нуля множителя из 
поля Р. Действительно, пусть 

ФМ=уі(*)=-з-*(*>. 

где ц(х) — снова примитивный многочлен. Тогда 

аіі (х)=Ьср (х). 

Таким образом, ай и Ьс получены вынесением всех общих множителей из 
коэффициентов одного и того же многочлена надкольцом Р [х 1г х % , .... х п ]. 
Отсюда вытекает, ввиду справедливости в этом кольце (по предположению 
индукции) теоремы об однозначности разложения, что ай и Ьс могут отли- 
чаться друг от друга лишь множителем нулевой степени. Таким же множи- 
телем, следовательно, отличаются друг от друг примитивные многочлены 
!(х) и §(х). 

П роизведению двух многочленов из кольца <2 [х] соответствует произ- 
ведение соответствующих им примитивных многочленов. В самом деле, 
если 

<р(*) = у /:(*), Ф (х)л=~§(х), 
где і (х) и § (х) — примитивные многочлены, то 

ПС 

Ф(х) ф (х)=-^[(х)і(х). 

Но, как доказано выше, произведение ^ (х) § ( х ) является примитивным много- 
членом. 

Отметим, далее, что если многочлен ф (х) из кольца <2 [х] неприводим 
над полем (2, то соответствующий ему примитивный многочлен 
рассматриваемый как многочлен от х, х г , х. 2 х п , также будет непри- 

водимым, й обратно. В самом деле, если многочлен / приводим, 
то оба множителя должны содержать неизвестное х, так как иначе много- 
член /; не был бы примитивным. Отсюда вытекает разложение многочлена 
Ф ( х ) над полем С } ■ 

ф (*) = у ^( л '> = ( у 

Обратно, если многочлен ф (х) приводим над <2, Ф (х) = ф х (х) ф 2 (х), то при- 
митивные многочлены / х (х) и / 2 (ж), соответствующие многочленам ф х (х) 
и ф 2 (х), будут оба содержать х, но их произведение, как доказано выше, 
равно /; ( х ) (с точностью до множителя из поля Р). 

Возьмем теперь примитивный многочлен / и разложим его на неприво- 
димые множители, / = /і • ^2 ... [ к . Все эти множители не только должны 
содержать неизвестное х, но даже будут примитивными многочленами, так 
как иначе многочлен / не был бы примитивным. Это разложение прими- 
тивного многочлена { будет однозначным с точностью до множителей 
из поля Р. В самом деле, ввиду предшествующей леммы, можно смотреть 
на это разложение как на разложение ^ (х) на неприводимые множители над 
полем <2, но для многочленов от одного неизвестного над некоторым полем 
однозначность разложения нам уже известна; эта однозначность имеет место 
с точностью до множителей из (2; однако в нашем случае, благодаря при- 
митивности всех множителей она будет с точностью до множителей из Р. 

После этих лемм, справедливость которых нами доказана, исходя из 
индуктивного предположения, доказательство нашей основной теоремы про- 
ходит без всяких затруднений. В самом деле, всякий неприводимый много- 
член из кольца Р [х, х 1} х 2 , ..., х п \ будет или неприводимым многочленом 



318 МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ [гл. 11 

из кольца Р [х х , х 2 , . .., х п \, или же неприводимым примитивным многочле- 
ном. Отсюда следует, что если нам дано некоторое разложение многочлена 
ф(х, х г , х 2 , . .., х п ) на неприводимые множители, то, объединяя множители, 
мы представим <р в виде 

Ф (х, х ъ х 2 Х„)=а (*!, х 2 , х п ) I (х, х х , х 2 , .... х п ), 

где а от х не зависит, а I, является примитивным многочленом. Мы знаем, 
однано, что это разложение для ф однозначно с точностью до множителей 
из Р. Так как, с другой стороны, однозначность разложения на неприводи- 
мые множители для многочлена а от л неизвестных имеет место по пред- 
положению индукции, а для примитивного многочлена I доказана в предше- 
ствующей лемме, то наша теорема для случая п + 1 неизвестных также 
полностью доказана. 

Из % доказанных выше лемм вытекает еще одно интересное следствие: 
если многочлен ф(х) с коэффициентами из Р [х г , х 2 , ...,х п ] приводим 
над полем (±—Р (х х , х 2 , .... х п ), то он может быть разложен на мно- 
жители, зависящие от х и имеющие коэффициентами многочлены из кольца 
Р [*]_, х 2 , ..., х„]. Действительно, если многочлену ф (х) соответствует при- 
митивный многочлен і;(х), т. е. ф(х)=а/(х), то, как мы знаем, из разложи- 
мости ф (х) следует разложимость 1(х)\ последнее приводит, однако, к раз- 
ложению ф (х) над кольцом Р [х х , х 2 , ..., х п ]. 

В отличие от случая многочленов от одного неизвестного, которые, как 
мы знаем из § 49, могут быть разложены на линейные множители над соот- 
ветственно подобранным расширением рассматриваемого основного поля, 
над любым полем Р существуют абсолютно неприводимые много- 
члены произвольной степени от нескольких (двух или более) неизвестных, 
т. е. многочлены, которые остаются неприводимыми при любом расширении 
этого поля. 

Таков, например, многочлен 

1(х, у) = ф(х) + і/, 

где ф(х) — произвольный многочлен от одного неизвестного над полем Р. 
Действительно, если бы в некотором расширении Р поля Р существовало 
разложение 

I (*> У) —8 (*. У) к (*> У). 

то, записывая § и к по степеням у, мы получили бы, что, например, 

р{х, у) ==а 0 (х)у + а 1 (х), И (х, у)=Ь 0 (х), 

т. е. к не зависит от у, а затем, ввиду а 0 (х) Ь 0 (х)= 1, что Ь 0 (х) имеет сте- 
пень 0, т. е. к не зависит и от х. 

Лексикографическое расположение членов многочлена. Для 
многочленов от одного неизвестного мы имеем два естественных спо- 
соба расположения членов — по убывающим и по возрастающим сте- 
пеням неизвестного. В случае многочленов от нескольких неизвест- 
ных такие способы уже отсутствуют: если дан многочлен пятой 
■ степени от трех неизвестных 

/ (^і, Х 2 , Хз) == ХуХ 2 Х$ Х 2 Хз х 2 х$ х 2 х 2 х 2 , 

то его можно было бы записать и в виде 


/(х х , Х 2 , Хз ) — Д'іД'з \ Х 2 Х^Х 2 Х 2 Х 2 Х$ 
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и нет оснований одну из этих записей предпочесть другой. Суще- 
ствует, однако, способ вполне определенного расположения членов 
многочлена от нескольких неизвестных, зависящий, впрочем, от вы- 
бора нумерации неизвестных; для многочленов от одного неизвест- 
ного он приводит к расположению членов по убывающим степеням 
неизвестного. Этот способ, называемый лексикографическим , под- 
сказан обычным приемом расположения слов в словарях («лексико- 
нах»): считая буквы упорядоченными так, как это принято в алфа- 
вите, мы определяем взаимное положение двух данных слов в словаре 
по их первым буквам, если же эти буквы совпадают, то по вторым 
буквам и т. д. 

Пусть дан многочлен /(х ІУ лг 2 , . . . , х п ) из кольца Р[х ІУ х 2 , . . ., х п ] 
и в нем два различных члена: 


у.^2 

Л і » 

уі I уіъ уІТХ 

Л 2 • • • 'А'П 1 


( 1 ) 

( 2 ) 


коэффициенты которых являются некоторыми отличными от нуля 
элементами из Р. Так как члены (1) и (2) различны, то хотя бы 
одна из разностей показателей при неизвестных 


й, — /,-, 2 = 1, 2, . . ., п, 

отлична от нуля. Член (1) будет считаться выше члена (2) (а член 
(2) — ниже члена (1)), если первая из этих разностей, отличная от 
нуля, положительна, т. е. если существует такое і, І^г'^л, что 

= ^1» ^2 ~ ^2’ • • • * ^/ — 1 = ^/ — 1» НО ^ > I [. 

Иными словами, член (1) будет выше члена (2), если показатель 
при х 1 в (1) больше, чем в (2), или если эти показатели равны, но 
показатель при лг 2 в (1) больше, чем в (2), и т. д. Легко видеть, 
что из того, что член (1) выше члена (2), не следует, что степень 
первого по совокупности неизвестных больше степени второго: из 
членов 

х 3 х х 2 х 3 , х\хІ х\ 


первый выше, хотя имеет меньшую степень. 

„Очевидно, что из любых двух различных членов многочлена 
/(х 1У х 2 , , . х п ) один будет выше другого. Легко проверить также, 
что если член (1) выше члена (2), а член (2), в свою очередь, выше 
члена 


лл, ..т, 

Лі Л/ о 


. Л, П у 


( 3 ) 


т. е. существует такое /, 1^/'^п, что 

/^ = /В 1, 1 2 = т 2 , . . 1^-1 — НО /^>2Ву, 

то, независимо от того, будет ли і больше, равно или меньше /, 
член (1) будет выше члена (3). Таким образом, ставя раньше тот 
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из двух членов, который выше, мы получим вполне определенное 
упорядочение членов многочлена /{х г , х 2 , . . . , х п ), которое и назы- 
вается лексикографическим. 

Так, многочлен 

] (х х 2 , х 3 , х == ^ х^ —[- Зх^х 2 х 2 ХіХ'^Хф -ф Зх-^ХдХ^ ф- 2х 2 -ф х$х ^ — 4 
расположен лексикографически. 

При лексикографической записи многочлена /(лг 1 , х 2 ,...,х п ) 
один из его членов будет стоять на первом месте, т. е. будет выше 
всех других членов. Этот член называется высшим членом много- 
члена-, в предшествующем примере высшим членом будет член х\. 
Относительно высших членов мы докажем лемм у, которая будет 
использована при доказательстве основной теоремы следующего 
параграфа: 

Высший член произведения двух многочленов от п неизвестных 
равен произведению высших членов сомножителей. 

В самом деле, пусть перемножаются многочлены /(х и х 2 , . . . ,х п ) 
и §(х ъ х 2 , ... ,х п ). Если 

ах\'х к г ...Хп п (4) 

будет высший член многочлена /(лг 1 , х 2 , . . . ,х п ), а 

а'лг^лг! 3 . . . х^ (5) 


— любой другой член этого многочлена, то существует такое /, 
1 ^ і п, что 

к і = 5 і> • • • > к і-і 

Если, с другой стороны, 

Ьх . . . х'п, (6) 

Ь'х{'х[* ... х 1 п п (7) 

будут высший и любой другой члены многочлена ^(х г , х 2 , ... , х а ), 
то существует такое у, Іг^у^л, что 


• • • > (/- 1 — (/ ф- 

Перемножая члены (4) и (6), а также члены (5) и (7), мы получаем: 


аЬх\ 




^ П +/ П 
• Л П і 


( 8 ) 

‘х* ‘ х'п ■ ■« ( 9 ) 

Легко видеть, однако, что член (8) выше члена (9); если, напри- 
мер, і ^ у, то 


а’Ь'х * 1 + л *?* + < * ,- 5 »+'п 


к 1+ 1 1 5 1 “Ь ^1> • • • > к І-\ 4" А'-1 + Н0 к і + ^,0> 

так как &,■>$,-, Так же проверяется, что член (8) будет 

выше произведения членов (4) и (7), а также выше произведения 
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членов (5) и (6). Таким образом, член (8) — произведение высших 
членов многочленов /и § — будет выше всех других членов, полу- 
чающихся в результате почленного перемножения многочленов /а§, 
а потому этот член не уничтожается при приведении подобных 
членов, т. е. остается высшим членом в произведении /§\ 

§ 52. Симметрические многочлены 

Среди многочленов от нескольких неизвестных выделяются те, 
которые не меняются ни при какой перестановке неизвестных. 
В такие многочлены все неизвестные входят, следовательно, вполне 
симметричным образом, и поэтому эти многочлены называются 
симметрическими многочленами (или симметрическими функ- 
циями). Простейшими примерами будут: сумма всех неизвестных 
лг і + л: 2+ ••• +*„, сумма квадратов неизвестных ... 

. . . +лгп, произведение неизвестных х х х 2 . . ,х п и т. д. Ввиду пред- 
ставимости всякой подстановки п символов в виде произведения 
транспозиций (см. § 3), при доказательстве симметричности не- 
которого многочлена достаточно проверить, что он не меняется ни 
при какой транспозиции двух неизвестных. 

Мы будем рассматривать дальше симметрические многочлены от п 
неизвестных с коэффициентами из некоторого поля Р. Легко видеть, 
что сумма, разность и произведение двух. симметрических много- 
членов сами будут симметрическими, т. е. симметрические много- 
члены составляют подкольцо в кольце Р[х г , х 2 , . . . , х п ] всех мно- 
гочленов от п неизвестных над полем Р, называемое кольцом 
симметрических многочленов от п неизвестных над полем Р. 
К этому кольцу принадлежат все элементы из Р (т. е. все много- 
члены нулевой степени, а также нуль), так как они заведомо не 
меняются ни при какой перестановке неизвестных. Всякий другой 
симметрический многочлен непременно содержит все п неизвестных 
и даже имеет по ним одну и ту же степень: если симметрический 
многочлен х 2 , . . . , х п ) обладает членом, в который неизвест- 

ное х { входит с показателем к, то обладает и членом, получающимся 
из него транспозицией неизвестных х ( и х^ т. е. содержащим не- 
известное X] в той же степени к. 

Следующие п симметрических многочленов от п неизвестных 
называются элементарными симметрическими многочленами-. 

01 = ^ 1+^2 + • • ■ +•*'«> 

С 2 = Х у Х % + Х^Х Ъ + . . . + ЛГ„_іАГ„, 

°3 = Х 1 Х І Х 3 -ф х х х 2 х і х п _, 2 х п _ Х х п , 


О п _ 1 — х 1 х 2 . ■ • Х п _ 1 х х х 2 . . . х п _ 2 Х п + . . . + Х 2 Х 3 . . . х п , 

°п=Х 1*2 ... ДГ„. 


0 ) 
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Эти многочлены, симметричность которых очевидна, играют в тео- 
рии симметрических многочленбв очень большую роль. Они подска- 
заны формулами Вьета (см. § 24), и поэтому можно сказать, что 
коэффициенты многочлена от одного неизвестного , имеющего 
старшим коэффициентом единицу, будут, с точностью до знака , 
элементарными симметрическими многочленами от его корней. 
Эта связь элементарных симметрических многочленов с формулами 
Вьета будет весьма существенна для тех применений симметрических 
многочленов к теории многочленов от одного неизвестного, ради 
которых мы сейчас их изучаем. 

Так как симметрические многочлены от п неизвестных х х , х 2 , . . . 

. . . , х п над полем Р составляют кольцо, то очевидны следующие 
утверждения: симметрическим многочленом будет всякая целая 
положительная степень любого из элементарных симметрических 
многочленов, а также произведение таких степеней, притом взятое 
с любым коэффициентом из Р, и, наконец, всякая сумма указанных 
произведений. Иными словами, всякий многочЛен от элементарных 
симметрических многочленов а,, а 2 , . . . , а п с коэффициентами 
из Р, рассматриваемый как многочлен от неизвестных х х , х 2 , . . . 
...,х п , будет симметрическим. Так, положим п = 3 и возьмем 
многочлен а 1 о 2 4-2а 3 . Заменяя а х , а 2 и а 3 их выражениями, мы 
получим: 

а г о 2 + 2ог 3 = х* х х 2 + х І х з + х і*1 + х\ х з + х і х з + Х 2 х з + ^ х і х 2 х з> 


справа стоит, очевидно, симметрический многочлен от х х , х г , х 3 ' 
Обращением этого результата является следующая основная 
теорема о симметрических многочленах: 

Всякий симметрический многочлен от неизвестных х х , х 2 , ... 
...,х п над полем Р является многочленом от элементарных 
симметрических многочленов с^, а 2 ,...,а п с коэффициентами, 
принадлежащими к полю Р. 

Пусть, в самом деле, дан симметрический многочлен 


/{ х х , х 2 , . • . , х п ) 

и пусть в его лексикографической записи высшим будет член 


а 0 х х ' х г г 


х* п 

• • . ■Л'П • 


( 2 ) 


Показатели при неизвестных в этом члене должны удовлетворять 
неравенствам 


К 


( 3 ) 


Действительно, пусть при некотором і будет к і <Р.к іл . х . 
/{х х , х 2 , . . . ,х п ), будучи симметрическим, должен 


однако, член 


а 2 х і х г г 


• * Хі + 1 • • • і 


Многочлен 

содержать, 


( 4 ) 
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получающийся из члена (2) транспозицией неизвестных х і и х і+1 . 
Это приводит нас к противоречию, так как член (4) в смысле лекси- 
кографического расположения выше члена (2): показатели при х ѵ 
х 2 , . . . , х,-_ 1 в обоих членах совпадают, но показатель при х ,• 
в члене (4) больше, чем в члене (2). 

Возьмем теперь следующее произведение элементарных симме- 
трических многочленов (ввиду неравенств (3) все показатели будут 
неотрицательными): 


Ф 1 = . . . вп п -~і~ кп о к п п . 


( 5 ) 


Это будет симметрический многочлен от неизвестных х 1г х 2 , . . . ,х п , 
причем его высший член равен члену (2). Действительно, высшие 
члены многочленов о 2 , о 3 , . . . , а п равны соответственно х 1 ,л: 1 л: 2 , 
х г х 2 х 3 , . . . , х г х 2 . . . х п , а так как в конце предыдущего параграфа 
доказано, что высший член произведения равен произведению выс- 
ших членов сомножителей, то высшим членом многочлена ф 1 будет 
а^х\'~ к '- (х 1 х 2 ) кг ~ кз {х г х 2 х ъ ) к ’~ к ' . . . 

. . . (х 1 х 2 , . . х п _ 1 ) *»-*“*» (х г х 2 . . . х п ) к п = а й х к 'х кг . . . х к п. 

Отсюда следует, что при вычитании ф 2 из /высшие члены этих 
многочленов взаимно уничтожатся, т. е. высший член симметриче- 
ского многочлена /~ф 1 =/і будет ниже члена (2), высшего в мно- 
гочлене /. Повторяя для многочлена / 2 , коэффициенты которого при- 
надлежат, очевидно, к полю Р, этот же прием, мы придем к равенству 


/і = Ф*+/«. 


где ф 2 есть произведение степеней элементарных симметрических 
многочленов с некоторым коэффициентом из поля Р, а / 2 — симме- 
трический многочлен, высший член которого ниже, чем высший 
член в Д. Отсюда вытекает равенство 

/=Фі + ф 2 +/ 2 - 

Продолжая этот процесс, мы для некоторого 5 получим Д = 0 и 
поэтому придем к выражению для /в виде многочлена от а 1 , <т 2 , . 

. . . , а п с коэффициентами из Р: 


3 

/(х ѵ х 2 , . . . , х„) = 2 ф,- = ф К, а 2 , , а п ). 

і=і 

В самом деле, если бы этот процесс был бесконечным х ), то мы 
получили бы бесконечную последовательность симметрических 
многочленов 

/і> (6) 


1 ) Следует учесть, что многочлен ф 5 содержит, вообще говоря, и такие 
члены, каких нет в многочлене [ 3 _ и и поэтому переход от [ я _і к = 
= / і5 _ 1 — «р^ связан не только с уничтожением некоторых членов из /_!, но 
и с появлением новых членов. Здесь $ = І, 2, ... 
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причем высший член каждого из них был бы ниже, чем высшие 
члены предшествующих многочленов, и тем более ниже, чем (2). 
Однако, если 

Ьху х‘і . . . х 1 " (?) 

есть высший член многочлена то из симметричности этого 
многочлена следуют неравенства 

... >/„, (8) 

подобные неравенствам (3). С другой стороны, так как член (2) выше 
члена (7), то 

к^іу. (9) 

Легко видеть, однако, что системы целых неотрицательных чисел 
Іу, / 2 , удовлетворяющих неравенствам (8) и (9), можно выбрать 

лишь конечным числом способов. Действительно, если даже отказаться 
от требования (8) и лишь предполагать, что 'все і— 1 , 2, . .. , и, 
не больше ку, то все равно выбор ' чисел будет возможен лишь 
(Л 1 -)-1)" способами. Отсюда следует, что последовательность много- 
членов (6) со строго понижающимися высшими членами не может 
быть бесконечной. 

Доказательство теоремы закончено. 

Отмеченная выше связь элементарных симметрических многочле- 
нов с формулами Вьета позволяет вывести такое важное след- 
ствие из основной теоремы о симметрических многочленах: 

Пусть /(х) есть многочлен от одного неизвестного надполем Р, 
имеющий, старшим коэффициентом единицу. Тогда всякий сим- 
метрический многочлен ( с коэффициентами из Р) от корней 
многочлена /( х ), принадлежащих к некоторому полю разложе- 
ния многочлена /(.ѵ) над Р, будет многочленом (с коэффициен- 
тами из Р) от коэффициентов многочлена / (. х ) и поэтому 
будет элементом поля Р. 

Изложенное выше доказательство основной теоремы дает заодно и метод 
для практического разыскания выражений симметрических многочленов через 
элементарные. Предварительно введем следующее обозначение: если 

ах\' х\* ... (Ю) 

есть некоторое произведение степеней неизвестных х г , х 2 х п (причем 

среди показателей могут быть и равные нулю), то через 

3 (ах\' х\' . . . х к ^) (11) 

будет обозначаться сумма всех членов, получающихся из (10) при всевоз- 
можных перестановках неизвестных. Очевидно, что это будет симметрический 
многочлен, притом однородный, и что всякий симметрический многочлен от п 
неизвестных, содержащий член (10), будет содержать и все остальные члены 
многочлена (11). Например, 5(х 1 ) = а і , 5(х 1 х 2 ) = о а , 5 (х^) есть сумма квад- 
ратов всех неизвестных и т. д. 
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Пример. Симметрический многочлен [ = 8 (х*х г ) от п неизвестных 
выразить через элементарные симметрические многочлены. 

Здесь высший член х^х 2 и поэтому ф 1 = о , ^ _1 сг 2 — о 1 а 2 , т. е. 

фі — ( Х 1 ‘ > Х, 1 ‘ К * ■ ■ + *„) ( Х 1 Х 2 + х і х 3 + • • • ~Ь х п — \ х п) = 

= 5 (х 4 х 2 ) -}■ 35 

откуда 

/і==/ — фі = — 35 (х 1 х-> х з) — Зо 3 . 

Поэтому / = ф 1 4-/ 1 = а,сг 2 — За 3 . 

В более сложных примерах целесообразнее предварительно установить, 
какие члены могут войти в выражение данного многочлена через элементар- 
ные, а затем найти коэффициенты этих членов методом неопределенных 
коэффициентов. 

Примеры. 1. Найти выражение для симметрического многочлена 

I =5 (ФО- 
МЫ знаем (см. доказательство основной теоремы), что члены искомого 
многочлена ф(а,, а 2 , ... , сг„) определяются через высшие члены симметри- 
ческих многочленов / 2 . . . , причем эти высшие члены ниже высшего члена 
данного многочлена і, т. е. ниже х\х\- Найдем все произведения х^х 1 2 ‘ . . .х 1 ", 
удовлетворяющие следующим условиям: 1) они ниже члена х 2 х 2 , 2) они могут 
служить высшими членами симметрических многочленов, т. е. удовлетворяют 
неравенствам ^ ^ 3) по совокупности неизвестных они имеют 

степень 4 (так как все многочлены / 1( / 2 , . . . имеют, как мы знаем, ту же 
степень, что и однородный многочлен (). Выписывая лишь соответствующие 
комбинации показателей и указывая рядом те произведения степеней о, кото- 
рые ими определяются, мы получаем следующую таблицу: 


22000. . . 

0 2-2 0 2-° =а 2 > 

21100. . 

.оГЧ 1 - , аГ° = 

11110. . 

• 0 Г І0 Г І0 Г І0 ; 

Таким образом, многочлен 

К имеет вид 




Коэффициент при о 2 мы положили равным единице, так как этог член опре- 
делен высшим членом многочлена / и имеет, как мы знаем из доказательства 
основной теоремы, такой же коэффициент. Коэффициенты Л и В мы найдем 
следующим образом. 

Положим х 1 = х 2 = х 3 =1, х 4 = . . . —х п = 0. Легко видеть, что при 
этих значениях неизвестных многочлен } получает значение 3, а многочлены 
° 2 > а з и а 4 — соответственно значения 3, 3, 1 и 0. Поэтому 

3 = 9+ Л-3-1 + Й-0, 

откуда А = — 2. Положим теперь х 1 = х 2 = х 3 — х 4 = 1, х 6 =...=х„ = 0. 
Значения многочленов /, а ь а 2 , о 3 и о 4 будут равны соответственно 6, 4, 6, 
4, 1. Поэтому 

6=36— 2-4-4 + В. 1, 

откуда В =2. Таким образом, искомое выражение для [ будет- 

! = с>1— 2<т х а 3 + 2а 4 . 
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2. Найти сумму кубов корней многочлена 

I (х) =х і + х 3 + 2х 3 + х + 1. 

Для решения этой задачи найде, ч выражение через элементарные сим- 
метрические многочлены для симметрического многочлена 5 (х®). Применяя 
тот же метод, как и в предыдущем примере, мы получим таблицу 

3000. . .а®, 

2100. . . о , 1 ст 2 , 

1110. . ,а 3 , 

а поэтому 

5 ( х і) — 0 1 “Ь Авіві ~Ь Во 3 . 

Полагая сперва х 1 =х 2 —1, х 3 —...—х п = 0, а затем х 1 = х 2 — х 3 = 1, 
х 4 — . . . =х п = 0, мы получим А== — 3, В = 3, т. е. 

■5 (х®) = <т® 3(і[0 2 -р Зо 3 . (12) 

Для нахождения суммы кубов корней данного нам многочлена / ' (х) 
нужно, ввиду формул Вьета, в найденном выше выражении заменить оу 
через коэффициент при х 3 с обратным знаком, т. е. через — 1, заменить сг 2 
через коэффициент при х 2 , т. е. через 2, и, наконец, заменить а 3 через 
коэффициент при х с обратным знаком, т. е. через — 1. Таким образом, 
интересующая нас сумма кубов корней равна 

(— і)3_ 3 .(_ і). 2 + 3.(_ 1) =2. 

Читатель может проверить этот результат, если учтет, что / (х) имеет 
1 Ѵз 1 і/'з' 

корнями числа і, — і , — ^ + г н — ^ ® чевидно также, что 

формула (12) не зависит от заданного многочлена { (х) и позволяет находить 
сумму кубов корней любого многочлена. 

Метод для выражения симметрического многочлена / через 
элементарные, полученный при доказательстве основной теоремы, 
приводит к вполне определенному многочлену от <т 1( о 2 , . . . , а п . 
Оказывается, что никаким способом нельзя получить для / иного 
выражения через а 1( сг 2 , . . . , о„. Это показывает следующая 
теорема единственности: 

Всякий симметрический многочлен обладает лишь единствен- 
ным выражением в виде многочлена от элементарных симметри- 
ческих многочленов. 

Докажем эту теорему. Если бы симметрический многочлен 
/(х г , х 2 , . . . , х п ) на полем Р обладал двумя различными выраже- 
ниями через о х , а 2 , . . . , а п \ 

/(х и х 2 , х„) = ф(а 1 , а. ог„) = ф(о 1 , а 2 , ... , ст„), 

то разность 

X К. о 2 ог„) = ф (а х , сг 2 , . . . , <т„) — і|з (а ѵ а 2 , ... ,а п ) 



СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ 


327 


§ 52] 

была бы отличным от нуля многочленом от ст х , о 2 . . . , о п , т. е. не 
все его коэффициенты были бы равны нулю, в то время как замена 
в этом многочлене а г , с 2 , . . . , о п их выражениями через х х , х 2 , . ■ ■ 

. . . , х п приводила бы к нулю кольца Р[х х , х 2 , ... , дг„]. Нам остается 
поэтому доказать, что если многочлен х(°і. • ■ • > ° п ) отличен от 

нуля, т. е. обладает хотя бы одним отличным от нуля коэффициентом, 
то и многочлен ^(х х , х 2 ,...,х п ), полученный из х заменой о х , 
с 2 , . . . , ст„ их выражениями через х х , х 2 , ... , х п : 

Х(°і> (У 2 , , о п ) = ^(л' 1 , лг 2 , . . . , х п ), (13) 

также отличен от нуля. 

Если аа\'а\- . . . а к п п — один из членов многочлена %, причем аф О, 
то после замены всех а их выражениями (1) мы получим многочлен 
от х х , х 2 , . . . , х п , высшим членом которого (в смысле лексикогра- 
фического расположения) будет, как мы уже знаем из доказатель- 
ства основной теоремы, член 

ах\' (х л х 2 ) кі . . . {х х х 2 . . . х п ) кп = ахіх'і . . . х‘$, 
где 


1 х — к у ф к 2 -\- . . 


Іг — к г ф . . 

• +*п> 


К- 


Отсюда 

кі — /,• + к п і 1 , 2, ... , п 1 , 

т. е. по показателям І ѵ / 2 , . . . , можно восстановить показатели 
к х , к г , . . . , к п исходного члена многочлена х- Таким образом, раз- 
личные члены многочлена х> рассматриваемые как многочлены от 
х ъ х г , ■ ■ ■ , л'„, обладают различными высшими членами. 

Рассмотрим теперь все члены многочлена х: для каждого из них 
найдем высший член его представления в виде многочлена от х х , 
х 2 , . . . , х„ и отберем тот из этих высших членов, который будет 
наивысшим в смысле лексикографического расположения. Как 
сказано выше, этот член не имеет подобных среди высших членов, 
получающихся из других членов многочлена %, а так как он, по усло- 
вию, выше каждого из этих высших членов, то тем более он выше 
других членов, получающихся при замене в членах многочлена % эле- 
ментов ог 1 , а 2 , . . . , а п их выражениями (1). Мы нашли, следова- 
тельно, такой член, который при переходе от х( с і> ° 2 > • • • > а п) 
к ^{х х , х 2 , ... , х„) появляется (с отличным от нуля коэффициентом) 
только один раз и поэтому ни с чем не может сократиться. Отсюда 
следует, что не все коэффициенты многочлена $ {х х , х 2 , . . . , х п ) 
равны нулю, т. е. этот многочлен не является нулем кольца 
Р[х х , х 2 , . . . ,х п ] ,что и требовалось доказать. 
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Доказанную теорему можно также, очевидно, сформулировать 
следующим образом: 

Система элементарных симметрических многочленов сг х , о 2 , . . ■. 

• • • . о„, рассматриваемых как элементы кольца многочленов 
Р[х г , х 2 , . .., х п ], алгебраически независима над полем Р. 

§ 53*. Дополнительные замечания о симметрических многочленах 

Замечания к основной теореме. Доказательство основной тео- 
ремы о симметрических многочленах, проведенное в предшествующем 
параграфе, позволяет сделать несколько существенных добавлений 
к формулировке теоремы, которыми мы ниже воспользуемся. Прежде 
всего, коэффициенты того многочлена ф (ст 1 , а 2 , ..., а п ), который 
найден нами в качестве выражения для симметрического многочлена 
/(х 1 , лг 2 , ..., лг и ) через элементарные симметрические многочлены, 
не только принадлежат к полю Р, но да^ке выражаются через 
коэффициенты многочлена / при помощи сложения и вычитания, 
т. е. принадлежат к кольцу Д порождаемому коэффициентами 
многочлена / внутри поля Р. 

В самом деле, все коэффициенты многочлена ф г (см. формулу (5) 
предшествующего параграфа) относительно неизвестных х х , х 2 , ... 
..., х„ суть, как легко видеть, целые кратные от коэффициента а 0 
при высшем члене многочлена /и поэтому принадлежат к кольцу I. 
Пусть уже доказано, что к /. принадлежат все коэффициенты 
(относительно х х , х г , ..., х п ) многочленов ф х , ф 2 , ..., ф,. Тогда 
коэффициенты многочлена Д =/ — ф г — ф 2 — ... — ф, также будут 
принадлежать к I, а поэтому в І лежат и все коэффициенты 
многочлена ф г+1 относительно х х , х г , х п . 

С другой стороны, степень многочлена ф (а„ о 2 , ...,<т п ) по 
совокупности а ѵ о 2 , . . ., а п равна степени, которую имеет мно- 
гочлен /{х х , х 2 , . . х п ) по каждому из неизвестных х х . В самом 
деле, так как (2) из предшествующего параграфа есть высший член 
многочлена /, то к х будет степенью /относительно неизвестногол:!, 
а поэтому, ввиду симметричности, и относительно любого другого 
из неизвестных х ; . Однако степень ф г по совокупности а равна, 
по (5) из предшествующего параграфа, числу 

{к х — к 2 ) + (к 2 — к 3 ) + . . . -ф (к п _ х — к п )-\- к п = к ѵ 

Далее, так как старший член многочлена / х ниже старшего члена 
многочлена /, то степень / х по каждому из х : будет не выше чем 
степень / по каждому из этих неизвестных. Однако многочлен ф 2 
играет для Д такую же роль, как ф г для /, поэтому степень ф 2 по 
совокупности а равна степени Д по каждому из х х , т. е. она не 
больше чем к х и т. д. Таким образом, и степень ф (а х , а 2 , ...,о„) 
не выше чем к ѵ Поскольку же никакое ф, сі>1 не может содер- 
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жать все о 1 , сг 2 , о„ в тех же степенях, что и <р 1 , то степень 

ср (а 1 , сг 2 , . . о п ) в точности равна к х . Тем самым наше утверждение 
доказано. 

Наконец, пусть ас 1 ' о 1 * . . . а 1 » будет один из членов многочлена 
Ф (а х , о 2 , ..., о„). Назовем весом этого члена число 

К + 2/ 2 -4- ... -г пІ п , 

т. е. сумму показателей, умноженных на индексы соответствующих а,-. 
Это будет, иными словами, степень взятого нами члена по совокуп- 
ности неизвестных х 1 , х а , . . ., х п , как вытекает из доказанной в § 51 
теоремы о степени произведения многочленов. Тогда справедливо 
следующее утверждение: 

Если однородный симметрический многочлен /{х г , х г , . . ., х п ) 
имеет по совокупности неизвестных степень з, то все члены его 
выражения ф(а 1 , а 2 , . . а„) через а будут одного и того же веса, 

равного з. 

Действительно, если (2) из предшествующего параграфа есть 
высший член однородного многочлена /, то 

5 = ~Ь ^2 ”Ь • • • ~Ь V 

Однако вес члена ср х равен, по (5) из предшествующего параграфа, 


{к 1 — к 2 ) + 2 {к 2 — к 3 ) + • • • + (я — 1) (к„-і — — 

~ &1 + + ^3 + • • • + 

т. е. также равен а. Далее, многочлен / 1 =/ — ф х как разность двух 
однородных многочленов степени а сам будет однородным степени $, 
а поэтому и член ф 2 многочлена ф будет веса $ и т. д. 

Симметрические рациональные дроби. Основная теорема о сим- 
метрических многочленах может быть распространена на случай 

рациональных дробей. Назовем рациональную дробь -- от п неиз- 

ё 

вестных х г , х. г , ..., х п симметрической , если она остается равной 
самой себе при любой перестановке неизвестных. Легко показать, 

что это определение не зависит от того, берем ли мы дробь — или 
г 8 

равную ей дробь — . Действительно, если и есть некоторая пере- 
до 

становка наших неизвестных, а ф — произвольный многочлен от этих 
неизвестных, то условимся через ф“ обозначать тот многочлен, 
в который переводится ф перестановкой со. По предположению, при 
любом со 

1-11 

г, > 
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т. е. /& из = &/ ш . С другой стороны, из 

А 

8 Во 

следует /ё 0 —ё/о< откуда Умножая обе части послед- 

него равенства на /, мы получаем: 

/гз=/ігя=8гя, 

откуда после сокращения на /° следует: т. е. 

Ц = 1 = А 

в? в Во' 

Справедлива следующая теорема: 

Всякая симметрическая рациональная дробь от неизвестных 

х ѵ х 2 х п с коэффициентами из поля Р представима в виде 

рациональной дроби от элементарных симметрических многочле- 
нов о х , о 2 , . . о„ с коэффициентами, снова принадлежащими к Р. 
Действительно, пусть дана симметрическая рациональная дробь 


!(х ѵ х 3 , .... х„) 

8(Хі, *„)' 

Предполагая ее несократимой, можно было бы доказать, что и/и^ 
будут симметрическими многочленами. Следующий путь будет, 
однако, более простым. Если многочлен § не является симметри- 
ческим, то умножаем числитель и знаменатель на произведение 
всех п\ — 1 многочленов, получающихся из % при всевозможных 
нетождественных подстановках неизвестных. Легко проверить, что 
знаменатель будет теперь симметрическим многочленом. Ввиду сим- 
метричности всей дроби отсюда следует, что числитель теперь 
также будет симметрическим, а поэтому для доказательства теоремы 
остается выразить числитель и знаменатель через элементарные сим- 
метрические многочлены. 

Степенные суммы. В приложениях часто встречаются симметри- 
ческие многочлены 

** = ■** + •**+•••+**> &=1 - 2 ’ 

т. е. суммы к-х степеней неизвестных х г , х 2 , . .., х п . Эти много- 
члены, называемые степенными суммами, должны выражаться, по 
основной теореме, через элементарные симметрические многочлены. 
Разыскание этих выражений является, однако, при больших к весьма 
затруднительным, и поэтому представляет интерес та связь между 
многочленами в 1 , $ 2 , ... и а х , а 2 , ..., о„, которая будет сейчас 
установлена. 
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Прежде всего 5 1 =<т 1 . Далее, если к^п, то легко проверить 
справедливость равенств 


8 к- 1 а 1 — 8 к 
8 к- чР 2 = ^ 

+ 5 {х ь 

+ 5 

' Х к ~ 2 Х 


8 к-і°і = 5 

'х к і ~ і * 1 Х 

* ' * Х 

,) + 5 

[х к ~ / х 2 . . .ХіХ і+1 ), 
2е^«/е— 2, 

8 1 а к-1 = ^ 

( Х 1 Х 2 • • 

■ Х к- 


*■ 


О) 


Беря альтернированную сумму этих равенств (т. е. сумму с чередую- 
щимися знаками), а затем перенося все члены в одну часть равен- 
ства, мы получим следующую формулу: 

5 к — 8 к- і°і + 5 к-і а г — • • • + ( — 1)* _ 1 ' у і сг *-і + ( — \ ) к к а к — 0 (2) 

(&Ся). 

Если же то система равенств (1) примет вид 


Г *-1®1=** + 5 И _ІД? 2) 

» 


2° 2 = 5 ( Х і~ 1Х 2)+5 

( х і~ ?х 2 х 3 ф 


,. 1 о. = 5(^- ( +^ 2 ... 

*0+ 5 К - '*» • 

■ ■ *л+ 1). 

к-п а п~ $ ( Х і~ П + 1Х 2 •• 

• *„). 



откуда вытекает формула 


8 к — 8 к -\ а 1 + 8 к- 2 ° 2 ~- ■ ■ +( — (к>п). (3) 


Формулы (2) и (3) называются формулами Ньютона. Они связы- 
вают степенные суммы с элементарными симметрическими многочле- 
нами и позволяют последовательно находить выражения для « 1 , $ 2 , 
$ 3 , ... через о ѵ о 2 , . . ., а п . Так, мы знаем, что = о 1 , что вытекает 
и из формулы (2). Если, далее, к—2^п, то, по (2), а 2 — 5 х о х ф- 
+ 2ог 2 = 0, откуда 

5 2 =(Ті — 2 о 2 . 


Далее, при к = 3^п будет $ 3 — 5 , 2 СГ 1 — Зо 3 = 0, откуда, ис- 

пользуя найденные уже выражения для и $ 2 , получаем: 

$ 3 — о) — ЗОіОз Зет з , 


*) См. (11) предшествующего параграфа. 
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что нам уже известно (см. (12) из предшествующего параграфа). 
Если же к = 3, но п = 2, то, по (3), $ 3 — 8 г а 1 + $ г 0 а = 0, откуда 
5 3 = Оі — 3 а х а 2 . Пользуясь формулами Ньютона, можно получить 
общую формулу, выражающую 8 к через а,, а 2 , ..., сг„. Эта фор- 
мула, впрочем, весьма громоздка и мы не будем ее приводить. 

Если основное поле Р имеет характеристику 0 и поэтому деле- 
ние на любое натуральное число п имеет смысл х ), то формула (2) 
дает возможность последовательно выразить элементарные симме- 
трические многочлены а,, а 2 , ..., <л п через первые п степенных 
сумм $ 2 , •••> V Так, а поэтому 

° 2 = у(*Л-5 2 ) = ^(^-* 2 ), 

сг 3 = -д- ($ 3 “Ь ~ "б (®і -)- 2$ 3 ) 

и т. д. Отсюда и из основной теоремы вытекает следующий результат: 

Всякий симметрический многочлен от п неизвестных х 1г х 2> . . . 

. . . , х п над полем Р характеристики нуль представим в виде 
многочлена от степенных сумм $ 1( $. 2 , . . ., $ п с коэффициентами, 
принадлежащими к полю Р. 

Многочлены, симметрические по двум системам неизвестных. 

В следующем параграфе, а также в § 58 будет использовано одно 
обобщение понятия симметрического многочлена. Пусть даны две 
системы неизвестных х 1; х 2 , ..., х п и у х , у 2 , . .., у Т , причем их 
объединение 

Х 1< Х 2> • • •> Х ш У И У 2* • • •> У г (4) 

алгебраически независимо над полем Р. Многочлен над полем Р 
/(х г , х 2 , ..., х а , у ѵ у г , ..., у г ) называется симметрическим по 
двум системам неизвестных, если он не меняется при любых пере- 
становках неизвестных х, , х.,, ..., х п между собой и неизвестных 
У іі Ун • • • , У, между собой. Если для элементарных симметрических 
многочленов от х г , х 2 , . . х п мы сохраним обозначения о г , о> 2 , . . . , о п , 
а элементарные симметрические многочлены от у 1г у 2 , . . ., у Г обо- 
значим через Т], т 2 , ..., т г , то основная теорема обобщается сле- 
дующим образом. 

Всякий многочлен /(х г , х 2 , . . . , х п , у ѵ у 2 , . . . , у г ) над полем Р, 
симметрический по системам неизвестных х 1г лт 2 , . . . , х п и 
Ун У 2 і • • •> У г' представим в виде многочлена (с коэффициентами 
из Р) от элементарных симметрических многочленов по этим 
двум системам неизвестных: 

/( Х И Х 2 і • • • і Х п' У I’ У 2і • • • і У г) ~ Ф (®1> ®а> • • • і ®п' ^1» ^2’ • • • > Т^г)- 

*) В поле характеристики р выражение — не имеет смысла при а Ф О, 
так как в этом поле при любом х будет рх— 0. 
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В самом деле, многочлен / можно рассматривать как многочлен 
/(Уг, у 2 , у г ) с коэффициентами, являющимися многочленами от 
х к , х 2 , .. ., х п . Так как / не меняется при перестановках неизвест- 
ных х 1У х 2 , х п , то коэффициенты многочлена / будут симме- 

трическими многочленами от х ѵ х 2 , . . х п и поэтому, по основной 
теореме, представимы в виде многочленов (с коэффициентами из Р ) 
от о х , а 2 , а п . С другой стороны, многочлен /(у,, у 2 , ...,у г ), 
рассматриваемый над полем Р(х 1 ,х 2 , . . ., лс п ), будет симметрическим 
относительно _у 1 , _у 2 , ...,у г и поэтому представим в виде многочлена 
ф(т 1 , т 2 , . . ., т г ). Коэффициенты многочлена ф будут, как показано 
в начале настоящего параграфа, выражаться через коэффициенты 
многочлена /при помощи сложения и вычитания, а поэтому они также 
будут многочленами от о х , о 2 , а п . Это приводит, очевидно, 
к искомому выражению для / через сг 1 , а 2 , а п , х к , т 2 , ..., т г . 

Пр и мер. Многочлен 

!(*1, Ч, х 3 , у ѵ у^=х 1 х 2 х 3 —х 1 х г у 1 —х 1 х 2 у 2 —х 1 х я у 1 — 

— х 1 х я у 2 —х 2 х 3 у 1 — х 2 х я у 2 -Ь х г у х у 2 -\-х 2 у х у 2 + х я у х у 2 

симметричен как по неизвестным х ѵ х 2 , х 3 , так и по неизвестным у х , у 2 , но 
не будет , симметрическим по всей совокупности пяти неизвестных, как обна- 
руживается хотя бы при транспозиции неизвестных х х и у х . Найдем выра- 
жение для I через а х , о 2 , а 8 , х ѵ т 2 : 

{ — Х х Х 2 Х я — (х х Х 2 + Х Х Х Я -\-Х 2 Х я ) Уі — (Х Х Х 2 -(- Х 1 х :і Х 2 Х Я ) у 2 + 

+ ( Хі + х і + х 3 )у 1 у 2 =г- а 3 — а 2 (/! — а 2 у 2 + в х у х у 2 = а 3 — + о х % 2 . 

Доказанная сейчас теорема распространяется, понятно, также на 
случай трех и большего числа систем неизвестных. 

Для многочленов, симметрических по двум системам неизвестных, 
справедлива также теорема единственности представления 
через элементарные симметрические многочлены. Иными словами, 
справедлива следующая теорема: 

Объединенная система 

• • • > ^і> ^2> • • • і т/ 

элементарных симметрических многочленов от заданных систем 
неизвестных х ѵ х 2 , . х п и у х , у 2 , . .., у Г алгебраически неза- 
висима над полем Р. 

Пусть, в самом деле, существует многочлен 
ф (^1) ^2» * • • і *^1» *^2> • * • ) 

над полем Р, равный нулю, хотя не все его коэффициенты нули. 
Этот многочлен можно рассматривать как многочлен ф(т г т 2 , . . % г ) 
с коэффициентами, являющимися многочленами от ст х , <т г , 
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Можно считать, следовательно, что ф — многочлен от т 1 , т 2 , . . ., т г 
над полем рациональных дробей 

бі — Р (х ± , х 2 , . . . , х п ) . 

Система у ъ у 2 , ..., у г остается алгебраически независимой над 
полем С: если' бы для этой системы существовала алгебраическая 
зависимость с коэффициентами из (?, то, освобождаясь от знаме- 
нателей, мы получили бы алгебраическую зависимость в системе (4) 
против предположения. Опираясь на теорему единственности из 
предыдущего параграфа, мы получаем теперь, что система Х х ,т 2 , . . . 

. . ., т г также должна быть алгебраически независимой над полем О, 
а поэтому все коэффициенты многочлена ф равны нулю. Эти коэф- 
фициенты являются, однако, многочленами от сг 1; о 2 „ . . . , а п , а поэтому, 
снова на основании теоремы единственности для случая одной системы 
неизвестных (на этот раз системы х 1} х 2ь х п ), все коэффици- 

енты этих последних многочленов сами равны нулю. Этим доказано, 
что в противоречие с предположением все коэффициенты многочлена <р 
должны быть равными нулю. 

§ 54*. Результант. Исключение неизвестного. Дискриминант 

Если дан многочлен /(х ѵ х 2 х п ) из кольца Р[х х , х 2 , . . . , х п ], 

то его решением называется такая система значений для неизвестных 

Х 1 ~ °ц, ^2 ~ ®2> • • • ! "Фі = 1 

Взятых в поле Р или в некотором расширении Р этого поля, кото- 
рая обращает многочлен / в нуль: 

/(«!, а 2 , . . ., а„) = 0. 

Всякий многочлен /, степень которого больше нуля, обладает 
решениями: если неизвестное х г входит в запись этого многочлена, 
то в качестве а 2 , ..., а п можно взять по существу произвольные 
элементы из поля Р, лишь бы степень многочлена /(х 1 , а 2 , . . ., а п ) 
Оставалась строго положительной, а затем, используя теорему о суще- 
ствовании корня (§ 49), взять такое расширение Рполя Р, в кото- 
ром многочлен /{х х , а 2 , . . ., сс„) от одного неизвестного х г обладает 
корнем а х . Мы видим вместе с тем, что свойство многочлена сте- 
пени п от одного неизвестного обладать во всяком поле не более 
чем п корнями для многочленов от нескольких неизвестных пере- 
стает быть справедливым. 

Если дано несколько многочленов от п неизвестных, то можно 
поставить вопрос о разыскании решений, общих для всех этих много- 
членов, т. е. решений той системы уравнений, которая получается 
в результате приравнивания заданных многочленов нулю. Частный 
случай этой задачи, а именно случай систем линейных уравнений, 
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уже был подвергнут во второй главе детальному рассмотрению. 
Однако для противоположного частного случая одного уравнения от 
одного неизвестного, но имеющего произвольную степень, мы не 
знаем о корнях ничего, кроме того, что они существуют в некото- 
ром расширении основного поля. Разыскание и изучение решений 
произвольной нелинейной системы уравнений от нескольких неиз- 
вестных является, понятно, еще более сложной задачей, выходящей, 
впрочем, за рамки нашего курса и составляющей предмет особой 
математической науки — алгебраической геометрии. Мы же здесь 
ограничимся лишь случаем системы двух уравнений произвольной 
степени от двух неизвестных и покажем, что этот случай может 
быть сведен к случаю одного уравнения от одного неизвестного. 

Займемся сперва вопросом о существовании общих корней у двух 
многочленов от одного неизвестного. Пусть даны многочлены 

/(х) = а п х8 -\-а 1 х п ~ 1 а п _ г х-\- а п , ^ 

над полем Р, причем 0, Ь й Ф 0. 

Из результатов предшествующей главы без труда вытекает, что 
многочлены /( х ) и $(х) тогда и только тогда обладают общим 
корнем в некотором расширении поля Р, если они не являются 
взаимно простыми. Таким образом, вопрос о существовании общих 
корней у данных многочленов может быть решен применением к ним 
алгоритма Евклида. 

Сейчас мы укажем другой метод для получения ответа на этот 
вопрос. Пусть Р будет некоторое такое расширение поля Р, в кото- 
ром /(х) имеет п корней а ѵ а 2 , ..., а„, а д;(х) имеет х корней 
Р х , Р 2 , ..., Р/, в качестве Р можно взять поле разложения для 
произведения /(х)^(х). Элемент 

Я (/. 2) = а\К II П — Р/) (2) 

'■=і /= і 

поля Р называется результантом многочленов / {х) и % {х). Очевидно- 
что /(х) и р(х) тогда и только тогда обладают в Р общим кор- 
нем, если Р(/, §) — 0. Так как 

ё(х) = Ь 0 Ц (х — Р у ) 

/= і 

и поэтому 

<?(«,) =А П (а.—Р/), 

/=1 

то результант /?(/, $) может быть записан также в виде 

Ж/> і) = а 1 П 8 («,)• 

І = 1 


( 3 ) 
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Многочлены /( х ) и $(х) используются в определении резуль- 
танта не симметричным образом. Действительно, 

я (*, /) = К а о П П ф/ ■ - ' = ( ■ - ■ 1 Г ■ к (/, 8). (4) 

і= 1 і=і 

В соответствии с (3) Я (&, /) можно записать в виде 

Я(г,/) = «П/<РА (5) 

і=і 

Выражение (2) для результанта требует знания корней много- 
членов /(х) я @(х) я поэтому практически бесполезно для решения 
вопроса о существовании у этих двух многочленов общего корня. 
Оказывается, однако, что результант Я (/, &) может быть пред- 
ставлен в виде многочлена от коэффициентов а 0 , а ѵ . . . , а п , 
Ь 0 , Ъ х , , .., Ь $ многочленов /(х) и &(х). 


Возможность такого представления легко вытекает из результатов пред- 
шествующего параграфа. В самом деле, формула (2) показывает, что резуль- 
тант Я (/, §) является симметрическим многочленом от двух систем неизвест- 
ных: системы а х , сс 2 , . . ., а„ и системы р ь р 2 р 4 . Он представим поэтому, 

как доказано в конце предшествующего параграфа, в виде многочлена от 
элементарных симметрических многочленов по этим двум системам неизвест- 


ных, т. е., ввиду формул Вьета, в виде многочлена от частных — І , 


*=1, 2 п, и — - , / = 1, 2, ..., 5; множитель а* 6", включенный в (2), 


освобождает полученное выражение от а 0 и Ь 0 в знаменателях. Впрочем, 
было бы затруднительным разыскивать выражение результанта через коэф- 
фициенты при помощи методов, изложенных в предшествующих параграфах, 


и мы воспользуемся иным приемом. 


Выражение для результанта многочленов (1), которое мы найдем, 
будет годно для любой пары таких многочленов. Мы будем считать, 
точнее говоря, что система корней 

«і, «2- •••> ®„. Рі, Р*. .... Р, (6) 

многочленов (1) является системой яф-я независи- 
мых неизвестных, т. е. системой я + 5 элементов, 
алгебраически независимых над полем Р в смысле § 51 . 

Мы получим выражение для результанта, которое, рассматри- 
ваемое как многочлен от неизвестных (6) (после замены по форму- 
лам Вьета коэффициентов через корни), будет равно правой части 
равенства (2), также рассматриваемой как многочлен от неизвест- 
ных (6). 

Понимая равенство именно в смысле такого тождественного 
равенства относительно системы неизвестных (6), мы докажем, что 
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результант К (/,$) многочленов (1) равен следующему определи- 
телю порядка п 5: 


«0 

«1 

. . . 

а п 


“о 


... а п 



«о 

Щ а п 

^0 

А 


ь , 


Ь 0 

Ьі 

... к 



Ьо 

Ьі ... ь з 


5 строк 


п строк 


(7) 


(на свободных местах стоят нули). Строение этого определителя 
достаточно ясно; мы отметим лишь, что на его главной диагонали 
стоит у раз коэффициент а 0 и затем п раз коэффициент Ь у 

Для доказательства нашего утверждения мы двумя способам^ 
вычислим произведение а\ Ь*ОМ, где М есть следующий вспомо- 
гательный определитель порядка я + у: 


П + 5-1 

1 

РГ 8-1 • 

• РГ 8-1 

а" +5-1 

«Г 8 " 1 • 

. аГ 5 * 1 

П + 5-2 

1 

рп +5 - 2 < 

. р" +5 - 2 

а" +5 ~ 2 

а 2 +5_2 • 

• < + 

2 

1 

р 2 

.. Р 2 

а і 


•• «я 


р 2 

. р. 

а! 

а 2 

.. а,, 


1 

. 1 

1 

1 

. 1 


М является определителем Вандермонда и поэтому равен, как ука- 
зано в § 6, произведению разностей элементов его предпоследней 
строки, причем из всякого предшествующего элемента вычитается 
любой следующий элемент. Таким образом, 


м= П (Р,- — Ру) П П Фу — а і ) • П («,--«,) 

1<*'</<5 1=1 1=1 


и поэтому, ввиду (4), 

аІЬ п 0 ОМ = О-К(ё, /)• П (Р,- — Р У ) - П (а,— а,). (8) 

Вычислим, с другой стороны, произведение ОМ на основании 
теоремы об определителе произведения матриц. Перемножая соот- 
ветствующие матрицы и учитывая, что все а являются корнями 
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дли /( х ), а все р — корнями для &(х), мы получим: 


рм= 

РГ^(Рі) 

РГ 1 /ф 2 ) 

... РГ‘ДР.) о 

0 

0 

РГѴ(Рі) 

Р’Г'ДР.) 

... Р|-*/<Р,) 0 

0 

0 

Р1/(Р1> 

Ы (Р.) 

... Р,/(Р,) о 

0 

0 

ДРі) 

Др г ) 

... /(Р.) о 

0 

0 

0 

0 

0 а” -1 ^ (а х ) 

«" -1 г (<Ч) •• 

(<*„) 

0 

0 

о <- 2 й-( аі ) 

«Г 2 г (а,) .. 


0 

0 

... 0 а,§ (а х ) 

а 2 § (а 2 ) 

а„ё ( а п) 

0 

0 

... 0 ёШ 

ё (а 2 ) 

ё (а„) 


Применяя теорему Лапласа, вынося затем общие множители из столб- 
цов определителей и вычисляя остающиеся определители как опре- 
делители Вандермонда, мы получим: 

аіфМ=аІЬ п в П /Ф/)- П (Р, - Ру) -П *(«,)• II («,-«/) 


1=1 


1=1 ' 1 <*</<$ 
или, используя (3) и (5), 

<4 Ь п 0 ОМ = я (/, 8) Я (8, /) • П (р/ - Ру) * П 


1 <( < /<п 




1< і < / <П 


(а,— оу). (9) 


Мы получаем, что правые части равенств (8) и (9), рассматри- 
ваемые как многочлены от неизвестных (6), равны между собой. 
Обе части полученного равенства можно сократить на общие мно- 
жители, не равные тождественно нулю. Общий множитель /?(§-, /) 
не равен нулю: так как а 0 =^0 и Ь 0 ^=0 по условию, то достаточно 
подобрать для неизвестных (6) не равные друг другу значения 
(в основном поле или в некотором его расширении), чтобы из (4) 
получить отличное от нуля значение для многочлена К (8, /). Так же 
доказывается, что и другие два общих множителя отличны от нуля. 
Сокращая на все эти. общие множители, мы приходим к равенству 


Я(/, 8 ) =А (10) 

которое и требовалось доказать. 

Откажемся теперь от требования, чтобы старшие 
коэффициенты многочленов (1) были отличны от 
нуля 1 ). Об истинных степенях этих многочленов, можно, следова- 


1 ) Этот временный отказ от того условия о старшем коэффициенте мно- 
гочлена, которому мы следовали до сих пор, обусловлен дальнейшими при- 
ложениями: мы хотим рассматривать системы многочленов от двух неизвест- 

ных и будем одно из этих неизвестных относить в коэффициенты. Старшин 
коэффициент может, следовательно, обратиться в нуль при частных значе- 
ниях этого неизвестного. 
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тельно, лишь утверждать, что они не больше их «формальных» 
степеней п и, соответственно, у. Выражение (2) для результанта 
не имеет теперь смысла, так как рассматриваемые многочлены имеют, 
возможно, меньше корней, чем п или у. С другой стороны, опреде- 
литель (7) и теперь может быть написан, и так как уже доказано, 
что при ао= 7 ^= 0 , Ь 0 фО этот определитель равен результанту, то и 
в нашем общем случае назовем его результантом многочленов 
/( х ) и §(х) и обозначим через Я(/, §). 

Теперь уже нельзя, однако, рассчитывать на то, что равенство 
результанта нулю равносильно существованию у наших многочленов 
общего корня. Действительно, если а 0 =0 и 6 0 = 0, то Я {/, ^) = 0 
независимо от того, обладают ли многочлены /и ^общими корнями 
или нет. Оказывается, однако, что этот случай будет единственным, 
когда из равенства результанта нулю нельзя вывести заключение 
о существовании у данных многочленов общих корней 1 ). Именно, 
справедлива следующая теорема: 

Если даны многочлены (1) с произвольными старшими коэффи- 
циентами, то результант (7) этих многочленов тогда и только 
тогда равен нулю, если эти многочлены обладают общим корнем 
или же если их старшие коэффициенты оба равны нулю. 

Доказательство. Случай а 0 Ф 0, Ьо^О уже рассматривался 
выше, а случай а 0 — Ь 0 = 0 предусмотрен в формулировке теоремы. 
Нам остается рассмотреть случай, когда один из старших коэффи- 
циентов многочленов (1), например а 0 , отличен от нуля, а Ь 0 
равно нулю. 

Если Ь { — 0 для всех і, і — 0, 1, . . . , у, то Я(/, ^) = 0, так 
как определитель (7) содержит нулевые строки. В этом случае, однако, 
многочлен ^(л:) равен нулю тождественно и поэтому имеет общие 
корни с /( х ). Если же 

Ь й — Ь 1 =... — Ь к _ х — 0, но Ь к Ф 0, 6=^ у, 

и если 

то, заменяя в определителе (7) элементы Ь 0 , Ь г , ..., Ь к _ х нулями 
и применяя теорему Лапласа, мы придем, очевидно, к равенству 

ж /, е)=^жя ё). ( и ) 

Так как, однако, старшие коэффициенты обоих многочленов / и § 
отличны от нуля, то, по доказанному выше, равенство Я {/, ^)=0 
необходимо и достаточно для существования общего корня у много- 
членов / и С другой стороны, по (11), равенства Я (/, ^) = 0 
и Я (/, |Г) = 0 равносильны, а так как многочлены § и § имеют, 

г ) Определитель (7) равен нулю, конечно, и при а„ = 6^ = 0. В этом 
случае, однако, многочлены (1) имеют общий корень 0. 



340 


МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ 


[ГЛ. 1 1 


понятно, одинаковые корни, то мы получаем, что и в рассматриваемом 
случае равенство нулю результанта Р (/, ^) равносильно существо- 
ванию общего корня у многочленов /(х) и ^(.х). Этим теорема доказана. 
Найдем результант двух квадратных многочленов 


По (7) 


/ (х) = а й к 2 + а г к + а 2 , § (х) = Ь 0 к‘ + Ь^х + Ь 2 . 




а 0 а г а 2 0 
0 а а а г а 2 
Ь а Ь , Ь„ 0 

О ь 0 ь, ь 2 


или, вычисляя определитель разложением по первой и третьей строкам, 

#(/. §) = («А — 0 А) 2 ~ (а А —а А,) (я А — афд- (12) 

Так, если даны многочлены 

І(х) = х 2 — 6х + 2, § (х) = х 2 + д»+5, 

то, по (12), 7? (/, §) = 233, и потому эти многочлены не имеют общих кор- 
ней. Если же даны многочлены 

7(х) = х 2 — 4х — 5, § (х) = х 2 —7х -\- 10, 

т0 Я (1< й) = Ѳ, т. е. эти многочлены обладают общим корнем; этим корнем 
является число 5. 


Исключение неизвестного из системы двух уравнений с двумя 
неизвестными. Пусть даны два многочлена / и § от двух неизвест- 
ных х и у с коэффициентами из некоторого поля Р. Мы запишем 
эти многочлены по убывающим степеням неизвестного х\ 


/(х, у) = аъ(у) х к + Чііу) х к ~ 1 + . . . + а^^у) х + а к (у), 1 
е(х. у) = (У) Х 1 + Ь 1 (у) X 1 - 1 + . . . + »,_ х (У)Х + Ъ 1 (у); ) 

коэффициенты будут многочленами из кольца Р[у\. Найдем резуль- 
тант многочленов / и рассматриваемых как многочлены от х, и 
обозначим его через Р х (/, &); он будет, ввиду (7), многочленом от 
одного неизвестного у с коэффициентами из поля Р: 

Д*(/> ё) = Г(У)- 04) 

Пусть система многочленов (13) обладает в некотором расшире- 
нии поля Р общим решением х — а, у — $. Подставляя в (13) 
вместо у значение (3, мы получим два многочлена /(х, Р) и ^(дг, Р) 
от одного неизвестного х. Эти многочлены обладают общим корнем а, 
а поэтому их результант, равный, ввиду (14), Рф), должен быть рав- 
ным нулю, т. е. р должно бить корнем результанта Р х (/, ^). 
Обратно, если результант Р х (/, §) многочленов (13) обладает корнем р, 
то результант многочленов /{х, Р) и §{х, Р) равен нулю, т. е. либо 
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эти многочлены обладают общим корнем, либо же оба их стар- 
ших коэффициента равны нулю, 


а 0 (Р) = МР)=0. 

Этим путем разыскание общих решений системы многочленов (13) 
сведено к разысканию корней одного многочлена (14) от одного не- 
известного у, т. е., как принято говорить, неизвестное х исключено 
из системы многочленов (13). 

Следующая теорема отвечает на вопрос о степени того многочлена, ко- 
торый мы получаем после исключения одного неизвестного из системы двух 
многочленов с двумя неизвестными: 

Если многочлены I (х, у) и % (х, у) имеют по совокупности неизвест- 
ных соответственно степени п и з, то степень многочлена Р х ({■, §) 
по неизвестному у не больше произведения пз, если, конечно, этот много- 
член не равен нулю тождественно. 

Прежде всего, если мы рассматриваем два многочлена от одного неиз- 
вестного со старшими коэффициентами, равными единице, то, по (2), их 
результант Р (%, §) является однородным многочленом от а ь а 2 , . . . , а п , 
Рх, ... , (3^ степени пз. Отсюда следует, что если в выражение резуль- 
танта через коэффициенты а х , а г , .... а п , Ь и Ь 2 , .... Ь 5 входит член 

а* ‘а 2* ... а к п п Ь 1 ^Ъ 1 * ... Ь 1 > 
и если весом этого члена будет названо число 


*і + + . • . + пк п + / х 4- 21 2 + . . . + $І іг 

то все члены выражения Р (Л, 8) через коэффициенты имеют один и тот же 
вес, равный пз. Это утверждение справедливо и в общем случае, для членов 
результанта (7), если весом члена а к ° а\' ... а*" Ь 1 ° Ь 1 ' ... Ь 1 5 в будет названо 
число 

0-* 0 +ЬА 1 + ...+лА я + 0./ в +1./х + ...+в/,. 05) 

Действительно, заменяя в членах определителя (7) множители а 0 и Ь 0 еди- 
ницей, мы приходим к уже рассмотренному случаю, однако показатели при 
этих множителях входят в (15) с коэффициентами 0. 

Запишем теперь многочлены і и в в следующем виде: 

I (*. У) = о 0 (у) х п + «1 (у) х п -! + . . . + а п {у), 

8 (х, у) = & 0 (у) х 5 + Ь 1 (у)х*~ 1 + ]- Ь 5 (у). 

Так как п есть степень |(х, у) по совокупности неизвестных, то степень 
коэффициента а г (у), г = 0, 1, 2, ... , п, не может превосходить его индекс г; 
это же верно и для Ь г (у). Отсюда следует, что степень каждого члена ре- 
зультанта Р х У, в) не больше веса этого члена, т. е. она не больше числа пз, 
что и требовалось доказать. 

Примеры. 

1. Найти общие решения системы многочленов 

І(х, у)=х і у+3ху+2у+3, 

В{х, у) = 2ху — 2х + 2(/+3. 
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(16) 


Исключим из этой системы неизвестное х, для чего перепишем ее 
в виде 

Их. у) = ух 2 + (3у)-х + (2у + 3).\ 
ё(х , у) = (2у—2)х + (2у + 3); / 

тогда 

У з у 2у + 3 
Р Х Ѵ, 0 = | 2у-2 2у + 3 О 
О 2у — 2 2у + 3 


= 2у 2 + Пу + 12. 
3 


Корнями результанта будут числа (5 Х = — 4, Р 2 = — . При этих значениях 

неизвестного у старшие коэффициенты многочленов (16) не обращаются 
в нуль, поэтому каждое из них вместе с некоторым значением для х со- 
ставляет решение заданной системы многочленов. Многочлены 

1(х, — 4) = — 4х 2 — 12х — 5, 

§(х, — 4) = — 10х — 5 

обладают общим корнем ~ . Многочлены 

г ( 3 \ 3.9 

Ч*’ 2 ) = 2 х 2 Х ’ 


8 


(-ІУ 


■5х 


имеют общий корень а а =*0. Таким образом, заданная система многочленов 
имеет два решения: 

1 3 

аі = — у. Рі = — 4 и «2 = °. Рг = — у 


2. Исключить одно неизвестное из системы многочленов 
[(х, у) = 2х 3 у—ху 2 +х + Ь, 

8(х, у) — х 2 у 2 + 2ху 2 —5у+1. 

Так как оба многочлена имеют по неизвестному у степень 2, тогда как 
у одного из них по неизвестному х степень 3, то целесообразно исключить у. 
Перепишем систему в виде 

1{х, у) = {—х)-у г + (2х 3 )-у + (х+Ъ), 

8 (х, у) = (х 2 + 2х)у 2 —5у+1 

и найдем ее результант, применяя формулу (12): 

Ду«, *)■=[(- х).1-(х+5)(х 2 + 2х)] 2 - 

— К— X) (— 5) - 2х 3 (х 2 + 2х)] [2х 3 ■ 1 — (х + 5) (— 5)] = 

= 4х 8 + 8х 7 + 1 1 х 9 + 84 х 5 + 161** + 154дг® + 96х 2 — 125*. 

Одним из корней результанта является 0. Однако при этом значении 
неизвестного х оба старших коэффициента многочленов (17) обращаются 
в нуль, причем, как легко видеть, многочлены /;(0, у) и §(0, у) не имеют 
общих корней. У нас нет способа найти другие корни результанта. Можно 
утверждать лишь, что если бы мы их нашли (например, в поле разложения 
для Я у (/, Ц ) ), то ни один из них не обращал бы в нуль оба старших коэф- 
фициента многочленов (17) и поэтому каждый из этих корней вместе с не- 
которым значением для у (одним или даже несколькими) составлял бы ре- 
шение заданной системы многочленов. 
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Существуют методы, позволяющие последовательно исключать 
неизвестные и из систем с произвольным числом многочленов и 
неизвестных. Эти методы, однако, слишком громоздки и поэтому 
не могут быть включены в наш курс. 

Дискриминант. По аналогии с вопросом, который привел нас 
к понятию результанта, можно поставить вопрос об условиях, при 
которых многочлен /(х) степени п из кольца Р\х] обладает крат- 
ными корнями. Пусть 

/(. х) = а й х п -\-а 1 х п - 1 -\ г . . . + а п _ 1 х-\- а п , а й фО, 

и пусть в некотором расширении поля Р этот многочлен имеет 
корни а х , а 2 , . . . , а„. Очевидно, что среди этих корней тогда и 
только тогда будут равные, если равно нулю произведение 

Д = (а 2 — а 1 )(а 3 — а х ) ... (а„— а х )х 
X (а 3 — а 2 ) (а 4 — а 2 ) ... (а„ — а 2 )х 


X К — а п _ х ) = П (а, — а у ) 

1 >/> 1 

или, что то же, если равно нулю произведение 
И = а\ п ~ г П (а, — а/, 

п >«•>/> 1 

называемое дискриминантом многочлена /(лг). 

В отличие от произведения Д, могущего менять знак при пе- 
рестановке корней, дискриминант й симметричен относительно 
а ѵ а 2 , . . . , а п и поэтому может быть выражен через коэффициенты 
многочлена /( х ). Для разыскания этого выражения в предполо- 
жении, что поле Р имеет характеристику нуль, 
можно воспользоваться связью, существующей между дискриминан- 
том многочлена /(х) и результантом этого многочлена и его про- 
изводной. Наличие такой связи естественно ожидать: мы знаем из 
§ 49, что многочлен тогда и только тогда обладает кратными кор- 
нями, если у него есть общие корни с производной /' (д;), а поэтому 
тогда и только тогда 0 = 0, если Р (/, /') = 0. 

По формуле (3) настоящего параграфа 

/?(/, Я = «Г 1 П /'(«,). 

і~х 

Дифференцируя равенство 

п 

/(*)=а 0 II (■* — «*). 

Й = 1 


П 


/(*) = а 0 2 П (-«—«/). 

Й = 1 / Г Л 


мы получаем: 
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После подстановки' сюда а ( - вместо х все слагаемые, кроме /-го, 
обращаются в нуль и поэтому 


/' (ос-) = а 0 II («,• — <Х/Ь 

і*і 


откуда 

я (/,/')= «Г 1 *» п П («,—«/). . 

1= 1 І 7=1 

В это произведение для любых / и у, і > у, входят два множителя: 
а,- — Яу и ау — а,-. Их произведение равно ( — 1)-(а, — Иу) 2 , а так как 
п ( п — 1) 

существует — — - пар индексов і, у, удовлетворяющих неравен- 
ствам л>/>у>1, то 


п(п-і ) 

я (/,-/') = (-!) 2 «Г - - 1 П 

1 


л (га-1) 

(а,- — «у)®= ( — 1) 8 а 0 О. 


Пример. Найдем дискриминант квадратного трехчлена 
1(х) = ах* + Ьх + с. 


Так как /'(*) = 2 ах + Ь, то 


Я([, П = 


а Ь с 
2а Ь О 
О 2а Ь 


— а ( — + 4ас). 


'В 


нашем случае 


п(п— 1) 
2 


и поэтому 


П = — І') = ь 2 —4ас. 


Это совпадает с тем, что в школьной алгебре называют обычно дискрими- 
нантом квадратного уравнения. 


Другой способ разыскания дискриминанта состоит в следующем. 
Составим определитель Вандермонда из степеней корней а ѵ а 2 , ..., и„. 
Как доказано в § б, 


1 

1 

... 1 


«1 


... а 0 


«I 


... а 2 

= П (а,— а-) = Д 


. і . , 

, . . . . 

п >(>/> 1 

«Г 1 

«Г 1 ■ 

... «Г 1 



а поэтому дискриминант равен квадрату этого определителя, умно- 
женному на аІ п ~ г . Умножая этот определитель на его транспониро- 
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§ 551 


ванный по правилу умножения матриц и вспоминая определенные 
в предыдущем параграфе степенные суммы, мы получим: 


п 

ч 

Ч ... 

5 п-1 

ч 

«2 

Ч ... 

5 П 

ч 

«3 

ч ... 

5 п+1 

8 п-1 

Ч 

8 и + 1 • • • 

Чп-2 


(18) 


где $ к есть сумма й-х степеней корней а 1 , а 2 , . . . , а п . 


Пример. Найдем дискриминант кубичного 
+ ах 2 + Ьх + с. По (18) 


П = 


3 

«2 


% 


«2 

*3 • 

5 4 


многочлена ^(х)=л: 3 ф- 


Как мы знаем из предыдущего параграфа, 


= а 4 = — а, 

$ 2 = 0 2 — 20 2 = а 2 — 2&, 

$з = — 3п 4 0 2 ЗОд = — п 3 3 йЬ — 3 с. 

Пользуясь формулой Ньютона, мы найдем также, ввиду 0 4 = О, что 
5 4 = о* — 4а 4 0 2 + 40^3 +2 о® = а 4 — 4а 2 6 + 4ас + 2Ь 2 . 

Отсюда 

О = 35 2 5 4 -(-гз^Яз — 8® — 5 4 5 4 — За“ =. 

— а 2 Ь 2 — ІЬ 3 — 4а*с + 1 8а6с — 27с г . (19) 

В частности, при а — 0, т. е. для неполного кубичного многочлена, 
мы получаем 

0 = — 4* 3 — 27с 2 . 


в полном соответствии с тем, что было сказано в § 38. 


§ 55*. Второе доказательство основной теоремы алгебры 
комплексных чисел 

Доказательство основной теоремы, приведенное в § 23, было 
совершенно неалгебраическим. Мы хотим изложить сейчас другое 
доказательство, использующее большой алгебраический аппарат — 
так, в нем существенно используется основная теорема о симме- 
трических многочленах (§ 52), а также теорема о существовании 
поля разложения для всякого многочлена (§ 49), — в то время как 
неалгебраическая часть этого доказательства является минимальной 
и сведена к одному весьма простому утверждению. 

Заметим сначала, что в § 23 доказана лемма о модуле старшего 
члена многочлена. Считая коэффициенты многочлена /( х ) действи- 
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тельными и полагая к — 1, мы получаем из этой леммы такое 
следствие: 

При действительных значениях х, достаточно больших по 
абсолютной величине, знак многочлена /{х) с действительными 
коэффициентами совпадает со знаком его старшего члена. 

Отсюда вытекает следующий результат: 

Многочлен нечетной степени с действительными коэффици- 
ентами имеет хотя бы один действительный корень. 

В самом деле, пусть 

/(х) = а 0 х п +а 1 х п ~ 1 + . . .'+а п , 

причем все коэффициенты действительны. Ввиду нечетности п стар- 
ший член а 0 х п имеет при положительных и отрицательных значениях л: 
разные знаки, а потому, как доказано выше, при положительных и 
отрицательных значениях х, достаточно больших по абсолютной 
величине, многочлен /(х) также будет иметь разные знаки. Суще- 
ствуют, следовательно, такие действительные значения х, например 
а и Ь, что 

/(а) < 0, / (Ь) > 0. 

Из курса анализа известно, однако, что многочлен (т. е. целая ра- 
циональная функция) /(х) является функцией непрерывной, а поэтому, 
ввиду одного из основных свойств непрерывных функций, при неко- 
торых действительных значениях х, заключенных между а и Ь, /( х ) 
принимает любое заданное значение, промежуточное между /(а) и 
/(&). Существует, в частности, такое а, лежащее между а и Ь, 
что /(а) = 0. 

Опираясь на этот результат, мы докажем теперь следующее 
утверждение: 

Всякий многочлен произвольной степени с действительными 
коэффициентами имеет хотя бы один комплексный корень. 

Пусть, в самом деле, дан многочлен /(х) с действительными 
коэффициентами, имеющий степень п — где ц — нечетное число. 
Так как случай к — 0 уже рассмотрен выше, мы будем полагать 
0, т. е. считать п четным числом, и будем вести доказательство 
индукцией по к , предполагая, что наше утверждение уже доказано 
для всех многочленов с действительными коэффициентами, степень 
которых делится на 2* _1 , но не делится на 2 к1 ). 

Пусть Р будет полем разложения для многочлена /(х) над полем 
комплексных чисел (см. § 49) и пусть а х , <х 2 , ...,а п будут корни 
/(х), содержащиеся в поле Р. Выберем произвольное действитель- 
ное число с и возьмем элементы поля Р, имеющие вид 

Р.7=“,-“у+ с («,- + <*/), *</'• 0) 

Эта степень может, следовательно, быть даже больше п, 
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Число элементов (5. у равно, очевидно, 

- {П ~ 1) = =. 2 *- V (2 й ? - 1) = 2 й - V, (2) 

где д' есть нечетное число. 

Построим теперь многочлен ^(л:) из кольца Р[дс], имеющий сво- 
ими корнями все эти элементы и только их: 

еН= П (х—Рі/)- 

і . /. ‘<1 

Коэффициенты этого многочлена являются элементарными симметри- 
ческими многочленами от (3 ( у. Они будут, следовательно, ввиду (1), 

многочленами от а ѵ а 2 > а п с действительными коэффициентами 

(так как число с действительное), причем даже симметрическими 
многочленами. В самом деле, транспозиция любых двух а, напри- 
мер а к и а, с , влечет за собой лишь перестановку в системе всех (3,-у: 
всякое Р А у, где у отлично от к и от /, превращается в р г у и обратно, 
в то время как и все Р ( у при і и у, отличных от к и /, остаются 
на месте. Однако коэффициенты многочлена ^(л:) не меняются при 
перестановке его корней. 

Отсюда следует, ввиду основной теоремы о симметрических 
многочленах, что коэффициенты многочлена §(х) будут многочленами 
(с действительными коэффициентами) от коэффициентов заданного 
многочлена /(х) и поэтому сами будут действительными числами. 
Степень этого многочлена, равная числу корней Р,у, делится, по (2), 
на 2 А_1 , но не делится на 2*. Поэтому, по предположению индук- 
ции, хотя бы один из корней р г у многочлена &(х) должен быть 
комплексным числом. 

Таким образом, при всяком выборе действительного числа с 
можно указать такую пару индексов і, у, где 1 1 =^у<л, 

что элемент является комплексным числом — на- 

помним, что поле Р содержит поле комплексных чисел в качестве 
подполя. Понятно, что при другом выборе числа с ему будет соот- 
ветствовать в указанном смысле, вообще говоря, другая пара индек- 
сов. Однако существует бесконечно много различных действитель- 
ных чисел с, в то время как в нашем распоряжении находится лишь 
конечное число различных пар і, у. Отсюда следует, что можно 
выбрать такие два различных действительных числа с х и с 3 , 
с 1 с 2 , что им соответствует одна и та же пара индексов 
і, ), для которых 

а і а / +с 1 (а, + а у ) = а, ) 
а і а / +с г {а і +а у ) = Ь \ 


являются комплексными числами. 
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Из равенств (3) вытекает: 

(«і — с 2 )(а 1 - + а / ) = а — Ь, 

откуда следует: 


т. е. эта сумма оказывается комплексным числом. Отсюда и хотя 
бы из первого из равенств (3) следует, что произведение а і а.^ 
также будет комплексным числом. Таким образом, элементы а,- и ѵ.] 
оказываются корнями квадратного уравнения 

х 2 — (а • -\-а])х-\- ар] = О 

с комплексными коэффициентами и поэтому, как вытекает из фор- 
мулы для решения квадратного уравнения с комплексными коэффи- 
циентами, выведенной в § 38, они сами должны быть комплексными 
числами. Мы нашли, следовательно, среди корней многочлена /(х) 
даже два комплексных корня и этим доказали наше утверждение. 

Для полного доказательства основной теоремы остается рассмот- 
реть случай многочлена с произвольными комплексными коэффи- 
циентами. Пусть 

/(х) = а 0 х п + а 1 х п ~ 1 + . ..+а п 
будет такой многочлен. Возьмем многочлен 

/ (х) = а 0 х п а х х п ~ 1 + . . • + а п > 

полученный из /(х) заменой всех коэффициентов сопряженными 
комплексными числами, и рассмотрим произведение 

Г(х)*=/(х)/(х) = Ь й х іП + Ь 1 х 2П ~ 1 + ...+Ь к х* п - к + 

где, очевидно, 

ь к= ^ а і а р А = 0, 1, 2, . . ., 2 п. 

і+І=к 

Опираясь на известные нам из § 18 свойства сопряженных комп- 
лексных чисел, мы получаем, что 

~Ь к = ^ ®* а /=Л. 

’і+1=к 

т. е. все коэффициенты многочлена Р(х) оказываются действитель- 
ными. 

Отсюда, как доказано выше, следует, что многочлен Г (х) обла- 
дает хотя бы одним комплексным корнем |3, 

НР)=/(Р)7(Р) = о, 
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т. е. или /(р) = 0, или же /(|}) = о. В первом случае теорема дока- 
зана. Если же имеет место второй случай, т. е. 

а оР’ ! + а іР" -1 + . . • + а л = 0, 

то, заменяя все входящие сюда комплексные числа им сопряженными 
(что, как мы знаем, не нарушает равенства), мы получим: 

ЯР) = а 0 р я + «іГ - 1 + ...+<*„ =о, 

т. е. /( х ) имеет своим корнем комплексное число р. Доказательство 
основной теоремы закончено. 



ГЛАВА ДВЕНАДЦАТАЯ 

МНОГОЧЛЕНЫ С РАЦИОНАЛЬНЫМИ КОЭФФИЦИЕНТАМИ 


§ 56*. Приводимость многочленов над полем 
рациональных чисел 

Третьим числовым полем, которое наряду с полями действитель- 
ных и комплексных чисел представляет для нас особый интерес, 
является поле рациональных чисел; обозначим его через /?. Оно 
является самым малым среди числовых полей: как доказано в § 43, 
поле К содержится целиком во всяком числовом поле. Мы будем 
интересоваться сейчас вопросом о приводимости многочленов над 
полем рациональных чисел, а в следующем параграфе — вопросом 
о рациональных (целых и дробных) корнях многочленов с рацио- 
нальными коэффициентами. Еще раз подчеркнем, что это два разных 
вопроса: многочлен 

х* + 2л; 2 + 1 = (** + !)» 

приводим над полем рациональных чисел, хотя не имеет ни одного 
рационального корня. 

Что можно сказать о приводимости многочленов над полем /?? 
Заметим, прежде всего, что если дан многочлен /(х), коэффициенты 
которого рациональны, но не все целые, то, приводя коэффициенты 
к общему знаменателю и умножая / (х) на этот знаменатель, р-авный, 
например, к, мы получим многочлен к/{х), все коэффициенты кото- 
рого будут уже целыми числами. Очевидно, что многочлены /(дг) и 
к/(х) имеют одинаковые корни; с другой стороны, они одновре- 
менно будут приводимыми или неприводимыми над полем 
- Мы, однако, пока не получили права ограничиться в дальнейшем 
рассмотрением многочленов с целыми коэффициентами. В самом 
деле, пусть целочисленный многочлен §•(*) (т. е. многочлен с це- 
лыми коэффициентами) приводим над полем рациональных чисел, 
т. е. разложим на множители меньшей степени с рациональными 
(вообще говоря, дробными) коэффициентами. Следует ли отсюда 
разложимость § (х) на множители с целыми коэффициентами? Иными 
словами, не может ли многочлен с целыми коэффициентами, приво- 
димый над полем рациональных чисел, оказаться неприводимым над 
кольцом целых чисел? 
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Ответ на эти вопросы может быть получен при помощи рассмо- 
трений, аналогичных проведенным в § 51. Назовем многочлен /( х ) 
с целыми коэффициентами примитивным, если его коэффициенты 
в совокупности взаимно просты, т. е. не имеют общих делителей, 
отличных от 1 и —1. Если дан произвольный многочлен ф {х) с ра- 
циональными коэффициентами, то его можно, притом однозначным 
образом, представить в виде произведения несократимой дроби на 
некоторый примитивный многочлен: 

ф (х) = -^/(ху, (1) 

для этого нужно вынести за скобки общий знаменатель всех коэф- 
фициентов многочлена <р (х), а затем и общие множители из числи- 
телей этих коэффициентов; заметим, что степень /( х ) равна сте- 
пени ф(лг). Однозначность (с точностью до знака) представления (1) 
доказывается следующим образом. Пусть 

ф(*) = у/(*)=-^(*)> 

где ^(л;) — снова примитивный многочлен. Тогда 

асІ/(х) = Ьс§ (х). 

Таким образом, ай и Ьс получены вынесением всех общих мно- 
жителей из коэффициентов одного и того же целочисленного много- 
члена, а поэтому могут отличаться друг от друга лишь знаком. 
Отсюда следует, что и примитивные многочлены /(х) и §■(*) также 
могут отличаться друг от друга лишь знаком. 

Для целочисленных примитивных многочленов остается справед- 
ливой лемма Гаусса: 

Произведение двух целочисленных примитивных многочленов 
само есть примитивный многочлен. 

В самом деле, пусть даны примитивные целочисленные много- 
члены 

/(*) = «і** _1 4- ... +«,•**"' 4- •• ■ +«*. 

§ (х) — Ь 0 х 1 -)- Ъ г х 1 х -\- . . . -\-Ъ]Х 1 * 4- ...4~ Ь[ 

и пусть 

/М?М = ѵ‘ + Чс/ + '-Ч ... + с,. + ,* ( * +г >-"' +/ > + ... 4-с* +1 . 

Если это произведение не примитивно, то существует такое про- 
стое число р, которое служит общим делителем для всех коэффи- 
циентов с 0 , с 1 ,...,с к+1 . Так как все коэффициенты примитивного 
многочлена /\х) не могут делиться на р , то пусть коэффициент от- 
будет первым, на р не делящимся; аналогично через Ь / мы обозначим 
первый коэффициент многочлена &(х), не делящийся на р. Перемножая 
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почленно /{х) и §{х) и собирая члены, содержащие дЛ^+б-о'+Д 
мы получим: 

с і+/~ а Р]-\- а і~лР )+і 4* а і-гР]+г + а і+і^у-і + а і+ 2 ^у-а + ••• 

Левая часть этого равенства делится на р. На него заведомо делятся 
также все слагаемые правой части, кроме первого; действительно, 
ввиду условий, наложенных на выбор і и у, все коэффициенты 
я,_і, я-_ 2 , . а также Ь 1 _ х , Д_ 2 , ..., делятся на р. Отсюда сле- 
дует, что произведение аф] также делится на р , а поэтому, ввиду 
простоты числа р, на р должен делиться хотя бы один из коэффи- 
циентов я,., Ь у, что, однако, не имеет места. Этим заканчивается 
доказательство леммы. 

Переходим к ответу на поставленные выше вопросы. Пусть мно- 
гочлен §(х) степени п с целыми коэффициентами приводим над 
полем рациональных чисел: 

§ (х) — фх (х) ф 2 (*), 

где фі (дг) и ср 2 (я) — многочлены с рациональными коэффициентами 
и их степени меньше п. Тогда 


ф ,- (х) = ^-/і (•*), * = 1 , 2 , 

где ~ — несократимая дробь, /,• (л:) — примитивный многочлен. Отсюда 


і(х) = °^\/ 1 (х)/ і (х)}. 


Левая часть этого равенства является целочисленным многочленом, 
поэтому знаменатель Ь х Ь г в правой части должен сократиться. Однако 
многочлен, стоящий в квадратных скобках, будет, по лемме Гаусса, 
примитивным, поэтому всякий простой множитель из Ь х Ь г может 
сократиться лишь с некоторым простым множителем из а х а г , а так 
как а і и Ь і взаимно просты, і — 1 , 2, то число я 2 должно нацело 
делиться на Ь ѵ я, — на д 2 ; 

я 2 = 6іЯ 2 , я, — Ь 2 а х , 

Отсюда 

і(х) = а' 1 а' 2 / 1 (х)/ і (х). 

Присоединив коэффициент а х а г к любому из множителей Д (я), 
Д (дг), мы получим разложение многочлена § ( х ) на множители меньшей 
степени с целыми коэффициентами. Этим доказана следующая 
теорема: 

Многочлен с целыми коэффициентами, неприводимый над 
кольцом целых чисел, будет неприводимым и над полем рацио- 
нальных чисел. 
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Теперь мы получили, наконец, право ограничиваться в вопросах, 
относящихся к приводимости многочленов над полем рациональных 
чисел, рассмотрением разложений целочисленных многочленов на 
множители, все коэффициенты которых также целые. 

Мы знаем, что над полем комплексных чисел приводим всякий 
многочлен, степень которого больше единицы, а над полем действи- 
тельных чисел — всякий многочлен (с действительными коэффициен- 
тами), степень которого больше двух. Совсем иное положение 
в случае поля рациональных чисел: для любого п можно указать 
многочлен п-й степени с рациональными (даже целыми) коэф- 
фициентами, неприводимый над полем рациональных чисел. 
Доказательство этого утверждения основано на следующем доста- 
точном признаке неприводимости многочлена над полем /?, назы- 
ваемом критерием Эйзенштейна: 

Пусть дан многочлен 

/(х) = а 0 х п а 1 х п ~ 1 + . . , +а п _ 1 х-\-а п 

с целыми коэффициентами. Если хотя бы одним способом можно 
подобрать простое число р, удовлетворяющее следующим тре- 
бованиям: 

1) старший коэффициент а 0 не делится на р, 

2) все остальные коэффициенты делятся на р, 

3) свободный член, делясь на р, не делится на р 2 , 

то многочлен /( х ) неприводим на& полем рациональных чисел. 

В самом деле, если многочлен ф{х) приводим над полем Ц, то 
он разлагается на два множителя меньшей степени с целыми коэф- 
фициентами: 

/{х)-={Ь 0 х к -\-Ь 1 х к ~ 1 -\- . . . +Ь к ){с 0 х 1 + с 1 х 1 ~ 1 + . .. + с 2 ), 

где к<бп, 1<бп, к-\-1 = п. Отсюда, сравнивая коэффициенты 

в обеих частях этого равенства, получаем: 


а п-1 ~~ ^к С 1-1 ^к-1 с 1і | 

а п - 2 = ^к С 1 - 2 “Ь ^к-2 С р I 


( 2 ) 


Из первого из равенств (2) следует, так как а п делится на .р, 
а число р простое, что один из множителей Ь к , с ь должен делиться 
на р. Они оба не могут одновременно делиться на р, так как а п , 
по условию, не делится на р 2 . Пусть, например, Ь к делится на р 
и поэтому с с взаимно просто с р. Переходим теперь ко второму 
из равенств (2). Его левая часть, а также первое слагаемое правой 
части делятся на р , поэтому на р делится и произведение Ь к _ 1 с 1 \ 
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так как, однако, с г на р не делится, то на р будет делиться 
Ьк-і . Подобным же образом из третьего равенства (2) мы получим, 
что Ьк-і делится на р, и т. д. Наконец, из (6-)-1)-го равенства 
будет получено, что на р делится 'Ь 0 ; но тогда из последнего из 
равенств (2) вытекает, что на р делится а 0 , что противоречит 
предположению. 

Весьма легко для любого п написать целочисленные многочлены 
п- Й степени, удовлетворяющие условиям критерия Эйзенштейна и, 
следовательно, неприводимые над полем рациональных чисел. Та- 
ков, например, многочлен л:" + 2; к нему применим критерий 
Эйзенштейна при р — 2. 

Критерий Эйзенштейна является лишь достаточным условием не- 
приводимости над полем /?, но отнюдь не необходимым: если для 
данного многочлена /( х ) нельзя подобрать такого простого числа 
р, чтобы выполнялись условия критерия Эйзенштейна, то он может 
быть приводимым, как х г — 5л: + 6, но может быть и неприводимым, 
как лг а -)— 1 . Существует, помимо критерия Эйзенштейна, много 
других достаточных критериев неприводимости многочленов над 
полем 7?, впрочем менее значительных. Существует также метод, 
принадлежащий Кронекеру и позволяющий о любом многочлене 
с целыми коэффициентами решить, приводим ли он над полем 7? 
или нет. Этот метод, однако, очень громоздок и практически 
почт? неприменим. 

Пример. Рассмотрим многочлен 

і Р = = * Р ‘ І + * Р-а + ’ • • + * + ! - 

где р — простое число. Корнями этого многочлена служат корни р- й степени 
из единицы, отличные от самой единицы; так как эти корни вместе с 1 де- 
лят единичный круг комплексной плоскости на р равных частей, то много- 
член }р (х) называется многочленом деления круга. 

К этому многочлену не может быть непосредственно применен критерий 
Эйзенштейна. Совершим, однако, замену неизвестного, положив * = </ + !• 
Мы получим: 

= у [у р + РУ р ‘ 1 + Р -^-^У р - 2 + -..+Ру] = 

~у р ~ 1 + Р у р - г +^=^у р -Ч...+р. 

Коэффициенты многочлена §(у) являются биномиальными коэффициентами 
и поэтому все, кроме старшего, делятся на р, причем свободный член не 
делится на р 2 . Таким образом, согласно критерию Эйзенштейна многочлен 
§ (у) неприводим над полем /?. Отсюда следует неприводимость над полем 
7? многочлена деления круга } р (х). В самом деле, если 

ИЛИ 

#(0)=Ф(0+ 1 Ж? + 1 )- 
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§ 57*. Рациональные корни целочисленных многочленов 

Выше было указано, что вопрос о разложении данного много- 
члена над полем рациональных чисел на неприводимые множители 
ни имеет практически сколько-нибудь удовлетворительного решения. 
Однако частный случай этого вопроса, относящийся к выделению 
линейных множителей многочлена с рациональными коэффициента- 
ми, т. е. к разысканию его рациональных корней, уже весьма прост 
и решается без больших вычислений. Само собой разумеется, что 
вопрос о разыскании рациональных корней многочленов с раци- 
ональными коэффициентами ни в какой мере не исчерпывает об- 
щего вопроса о действительных корнях этих многочленов, т. е. 
методы и результаты, изложенные в девятой главе, сохраняют 
полностью свое значение и для многочленов с рациональными ко- 
эффициентами. 

Приступая к вопросу о разыскании рациональных корней мно- 
гочленов с рациональными коэффициентами, отметим, что, как 
было указано в предшествующем параграфе, можно ограничиться 
рассмотрением лишь многочленов с целыми коэффициентами; мы 
будем при этом рассматривать отдельно случай целых и случай 
дробных корней. 

Если целое число а служит корнем многочлена /( х ) с целы- 
ми коэффициентами, то а будет делителем свободного члена 
этого многочлена. 

В самом деле, пусть 

/ (х) — а 0 х п 4- а х х п - 1 + 

Разделим /( х ) на х — а: 

/(*) = (* — а) {р й х п -' + Ь 1 х п -* + . . . 

Выполняя деление методом Горнера, изложенным в § 22, мы 
получим, что все коэффициенты частного, в том числе и Ь п -и 
являются целыми числами, а так как 

а п ~ ссЬ п _ і = (X ( Ь п ~і), 

то наше утверждение доказано 1 ). 

Таким образом, если целочисленный многочлен /( х ) обладает 
целыми корнями, то они будут найдены среди делителей свобод- 
ного члена. Необходимо, следовательно, испытать всевозможные 
делители свободного члена, как положительные, так и отрицатель- 
ные; если ни один из них не является корнем многочлена, то це- 
лых корней наш многочлен вообще не имеет. 

х ) Было бы ошибкой доказывать эту теорему ссылкой на то, что сво- 
бодный член а п является (с точностью до знака) произведением всех кор- 
ней многочлена [ (х): среди этих корней могут встретиться и дробные, и 
иррациональные, и комплексные, и поэтому заранее нельзя утверждать, 
что произведение всех этих корней, кроме а, будет целым. 
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Испытание веек делителей свободного члена может оказаться 
весьма громоздким, если даже значения многочлена будут вычис- 
ляться методом Горнера, а не непосредственной подстановкой каж- 
дого из делителей вместо неизвестного. Следующие замечания поз- 
воляют несколько упростить эти вычисления. Прежде всего, так 
как Іи — 1 всегда служат делителями свободного члена, вычис- 
ляем /(1) и /( — 1), что не представляет затруднений. Если, да- 
лее, целое число а является корнем для /( х }: 

/(х) = (х—а)д(х). 


то, как указано выше, все коэффициенты частного д (х) будут це- 
лыми числами, и поэтому частные 


Ш 

а— 1 


-?(П. 


П-і) 

а + 1 


= -<7(-1) 


должны быть целыми числами. Таким образом,, подлежат испыта- 
нию лишь те делители а свободного члена {из числа отличных 

от 1 и ~1), для которых каждое из частных — Д , ■ - Ду яв- 

ОС 1 ОС 1 


ляется целым числом. 


Примеры. 1. Найти целые корни многочлена 
I (к) —х 3 -—2х г — к— 6. 

Делителями свободного члена служат числа +1, +2, ±3, ±6. Так как 
{(]) = — 8, К— 1) = — 8, то 1 и —1 не являются корнями. Далее, числа 

— 8 —8 —8 -8 
2 4-Г —2—1 ’ 6—1 ’ —6—1 

являются дробными, и поэтому делители 2, — 2, 6, — 6 должны быть отбро- 
шены, в то время как числа 

— 8 —8 —8 —8 
3—1’ 3 + 1 ’ —3—1 ’ —3 + 1 

— целые, и поэтому делители 3 и — 3 еще подлежат испытанию. Применим 
метод Горнера: 

II — 2 — 1 — 6 
— 3 | 1 — 5 14 — 48’ 


т. е. [( — 3)= — 48, и поэтому — 3 не является корнем для / ( х ). 


3 


1 — 2—1 —6 
112 0 ’ 


Наконец 


т. е. 1(3)— 0: число 3 служит корнем для [ (х). Одновременно мы нашли 
коэффициенты частного от деления ^(х) на х — 3; 

Цх)=(х-3)(х*+х+2). 

Легко видеть, что частное х 2 +х + 2 не имеет числа 3 своим корнем, т. е. 
это число не является кратным корнем для 1(х). 

2. Найти целые корни тшогочлена 

I (х) = Зх*-\-х 3 — 5х 2 — 2х + 2. 
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Здесь делителями свободного члена будут ±1 и ±2. Далее, / (1) = — 1, 
/(— 1)=1, т. е. 1 н — 1 не служат корнями. Наконец, так как числа 

1 —1 
2 + 1 И — 2—1 

дробные, то 2 и — 2 также не будут корнями и поэтому многочлен ( (х) 
вообще не имеет целых корней. 


Переходим к вопросу о дробных корнях. 

Если целочисленный многочлен, старший коэффициент кото- 
рого равен единице, имеет рациональный корень, то этот корень 
будет целым числом. 

Пусть, в самом деле, многочлен 


/ (х) = х п а 1 х п ~ 1 + а 2 х п ~ г -\- . . . 4 -а п 


с целыми коэффициентами имеет корнем несократимую дробь 
т. е. 


Отсюда 


ь п , ь п ~ х 

7п + а 1 ~^ГТ ' 


+ а„ — 0. 


ь п 

-= —аф п -' 

Г 1 


-а 0 Ь п ' 


— а п с п ~\ 


Ь 

о ’ 


т. е. несократимая дробь равна целому числу, что невозможно. 

Для получения всех рациональных ( дробных и целых) корней 
целочисленного многочлена 

/(х) = а 0 х п + а 1 х п -' + а 2 х п -*+ ... + а п _ 1 х+а п 
нужно найти все целые корни многочлена 

ф {у)=У п +а 1 у п - 1 + а 0 а 2 у п -*+ . . . + аГХ-цУ + а. п 0 ~ 1 а п 
и разделить их на а 0 . 

В самом деле, умножим /(х) на а" -1 , а затем совершим замену 
неизвестного, положив у = а 0 х. Очевидно, что 

ф ІУ) = ф (а 0 х) =«о _1 /(л). 


Отсюда следует, что корни многочлена /(х) равны корням много- 
члена ф {у), разделенным на а 0 , В частности, рациональным кор- 
ням /(х) будут соответствовать рациональные же корни ф (у); так 
как, однако, старший коэффициент ф (у) равен единице, то эти 
корни могут быть лишь целыми, и мы уже имеем метод для их разы- 
скания. 

Пример. Найти рациональные корни многочлена 
I (х) — Зх*-\-5х 3 -\-х 2 -\-5х — 2. 

Умножая ( (х) на З 3 и полагая у = Ъх, получим; 

Ф (</) = І/ 4 + 5у 3 + Зу 2 + 45у — 54 . 

Ищем целые корни многочлена <р (у). 
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Найдем ф (1) методом Горнера: 

I 1 5 3 45 —54 
1 I 1 6 9 54 0 ' 

Таким образом, <р(1)=0, т. е. 1 является корнем для ф (у), причем 

Ф (У)=(У—1)Ч(У), 
где 

Я ( У ) = У 3 + + 9 у + 54. 

Найдем целые корни многочлена д (у). Делителями свободного члена 
служат числа ±1, ±2, ±3, ±6, ±9, ±18, ±27, ±54. Здесь 

?(1) = 70, <?{ — 1) = 50. 

Вычисляя - Щ и ? ~ для каждого делителя а, мы обнаружим, что долж- 
(Х-— 1 ОС -г 1 

ны быть отброшены все делители, кроме а= — 6. Испытаем этот делитель: 


1 6 

9 

54 

1 0 

9 

0 


Таким образом, д( — 6) = 0, т. е. — 6 служит корнем для д (у) и поэтому 
для ф (у). 

Многочлен у (у) имеет, следовательно, целые корни 1 и— 6. Рациональ- 
ными корнями многочлена / (х) будут, таким образом, числа 4* и —2 и 

«5 

только они. 

Следует еще раз подчеркнуть, что изложенные выше методы 
применимы только к многочленам с целыми коэффициентами и 
только для разыскания их рациональных корней. 

§ 58*. Алгебраические числа 

Всякий многочлен п- й степени с рациональными коэффициентами 
имеет в поле комплексных чисел п корней, некоторые из которых 
(или даже все) могут лежать вне поля рациональных чисел. Однако 
не всякое комплексное или действительное число служит корнем 
некоторого многочлена с рациональными коэффициентами. Те ком- 
плексные (в частности, действительные) числа, которые являются 
корнями таких многочленов, называются алгебраическими числами 
в противоположность числам трансцендентным. К числу алгебраи- 
ческих чисел принадлежат все рациональные числа, как корни 
многочленов первой степени с рациональными коэффициентами 
а также всякий радикал вида а с рациональным подкоренным 
числом а, как корень двучлена х п — а. С другой стороны, в боль- 
ших курсах математического анализа доказывается трансцендент- 
ность числа е — основания системы натуральных логарифмов, а так- 
же известного из элементарной геометрии числа л. 

Если число а алгебраическое, то оно будет даже корнем неко- 
торого многочлена с целыми коэффициентами и поэтому корнем 
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§ 58] 

одного из неприводимых делителей этого многочлена также е це- 
лыми коэффициентами. Тот неприводимый целочисленный много - 
член, корнем которого является а, определен однозначно с точ- 
ностью до постоянного множителя, т. е. вполне однозначно, 
если потребовать, чтобы коэффициенты этого многочлена были 
в совокупности взаимно просты (т. е. чтобы многочлен был при- 
митивным). В самом деле, если а служит корнем двух неприводи- 
мых многочленов /( х ) и §(х), то наибольший общий делитель этих 
многочленов будет отличен от единицы, а потому эти многочлены, 
ввиду их неприводимости, могут отличаться друг от ‘друга лишь 
множителем нулевой степени. 

Алгебраические числа, являющиеся корнями одного и того же 
неприводимого (над полем Щ многочлена, называются сопряжен- 
ными между собой 1 ). Все множество алгебраических чисел распа- 
дается, следовательно, на непересекающиеся конечные классы со- 
пряженных между собой чисел. Всякое рациональное число как 
корень многочлена первой степени не имеет сопряженных чисел, 
отличных от самого себя, и это свойство является для рациональ- 
ных чисел характерным: всякое алгебраическое число, не являю- 
щееся рациональным, будет корнем неприводимого многочлена, 
степень которого больше единицы, и поэтому для него сущест- 
вуют сопряженные, отличные от него самого. 

Множество всех алгебраических чисел является подполем 
поля комплексных чисел. Иными словами, сумма, разность, 
произведение и частное алгебраических чисел сами будут алге- 
браическими числами. 

Пусть, в самом деле, даны алгебраические числа аир. Обо- 
значим через а!=а, а 2 . ..., а„ все числа, сопряженные с а, че- 
рез Рі === р, Р 2 , ..., р 5 — числа, сопряженные с Р, через /( х ) и 
^(я) — неприводимые многочлены с рациональными коэффициента- 
ми, имеющие своими корнями соответственно а и р. Напишем 
многочлен, корнями которого служат всевозможные суммы а і + Ру* 
это будет п 5 

фИ = ПП[^- (®і + Р у)]. 

<=і/=і 

Коэффициенты этого многочлена не будут, очевидно, меняться 
при перестановках всех а і между собой, а также всех ру между 
собой. Они являются, следовательно, на основании теоремы о 
многочленах, симметричных по двум системам неизвестных (см. 
конец § 53), многочленами от коэффициентов многочленов /(х) 
и §(х). Иными словами, коэффициенты многочлена <р (х) оказыва- 
ются рациональными числами, и поэтому число а+ Р —а г + 
являющееся одним из его корней, будет алгебраическим. 


] ) Не следует смешивать этого понятия с сопряженностью комплекс- 
ных чисел. 
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Таким же образом при помощи многочленов 

•И*) в ПП [* — («/-М 

і=і і=і 

и 

х(*)-п гі 

і=і /= і 

доказывается алгебранчность чисел а — р и сф. 

Для доказательства алгебраичности частного достаточно показать, 
что если число а — алгебраическое и отличное от нуля, то а -1 
также будет алгебраическим числом. Пусть а служит корнем мно- 
гочлена 

/{х)=а 0 х п + а 1 х п - 1 + ... -\-а п _ 1 х + а п 
с рациональными коэффициентами. Тогда, очевидно, многочлен 

' Р( х ) — а п х " а п-1 Х ’‘~ 1 + + а 1 * + а 0. 

также с рациональными коэффициентами, будет иметь своим кор- 
нем число а -1 , что и требовалось доказать. 

Из доказанной сейчас теоремы вытекает, что любая сумма ра- 
ционального числа и радикала, например 1 + ^/2, а также любая 
сумма радикалов, например ]/3 -)- {/5, будут алгебраическими чис- 
лами. Мы пока не можем, однако, утверждать алгебраичность чи- 
сел, записываемых в виде «двухэтажных» радикалов, например 

числа |/ г 1-|-]/ г 2. Это будет вытекать лишь из следующей тео- 
ремы: 

Если число со служит корнем многочлена 

у(х) = х п -\-ах п - 1 -\г§х п - г -{- ... + Яд; + р, 

коэффициенты которого — алгебраические числа, то ю также 
будет алгебраическим числом. 

Пусть а,-, Ру, . .., р, пробегают числа, сопряженные соот- 
ветственно с а, р, ..., К, р, причем а 1 =а, р х = р, .... Х 1 — Х, 
р х = р. Рассмотрим всевозможные многочлены вида 

Ф Ч,і «, і (х) = х п + сс.л:”- 1 + Ру*"- 2 + ... -р^дг + рх, 

так что <р ь і, ..., і, ! (х) = ср (х), и возьмем произведение всех этих 
многочленов 

Р{х) = П Фо і і (х). 

I, і, . . ..в, I 

Коэффициенты многочлена Р {х) симметричны, очевидно, по каж- 
дой из систем а і , ру, ..., р<, а поэтому (снова по теореме 

из § 53) они суть многочлены от коэффициентов тех неприводимых 
многочленов (с рациональными коэффициентами), корнями которых 
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служат соответственно а, §, . .., Я, ц, т. е. сами суть рацио- 

нальные числа. Число ©, являясь корнем для ф (х), будет, следо- 
вательно, корнем многочлена Р (х) с рациональными коэффициен- 
тами, т. е. будет алгебраическим числом. 

Применим эту теорему к числу ш = ]/і +ф^2. Число а= 1 -{- 
Ч-|/2 алгебранчно по предыдущей теореме и поэтому число со 
является корнем многочлена х 2 — ас алгебраическими коэффициен- 
тами, т. е. само алгебраично. Вообще, применяя несколько раз обе 
доказанные сейчас теоремы, читатель без труда придет к следую- 
щему результату: 

Всякое число, записываемое в радикалах над полем рацио- 
нальных чисел (т. е. выражающееся через сколь угодно сложную 
комбинацию радикалов, в общем случае «многоэтажных»), будет 
алгебраическим числом. 

Алгебраические числа, записываемые в радикалах, составляют, 
очевидно, поле. Следует помнить, однако, что это поле, как выте- 
кает из замечания, сделанного (без доказательства) в конце § 38, 
будет лишь частью поля всех алгебраических чисел. 

Выше была отмечена трансцендентность двух чисел: е и я. На самом 
деле, однако, трансцендентных чисел бесконечно много. Больше того, ис- 
пользуя понятия и методы, относящиеся к теории множеств, мы покажем, 
что трансцендентных чисел, так сказать, даже больше, чем чисел алгебра- 
ических; точный смысл этого выражения станет ясен ниже. 

Бесконечное множество М называется счетным, если оно может быть 
поставлено во взаимно однозначное соответствие с множеством натуральных 
чисел, т. е. если его элементы могут быть пронумерованы при помощи всех 
натуральных чисел, и несчетным — в противоположном случае. 

Лемма 1. Всякое бесконечное множество М содержит счетное подмно- 
жество. 

В самом деле, возьмем в М произвольный элемент а ѵ Выберем затем 
элемент а 2 , отличный от а ѵ Вообще, пусть в М уже выбрано п различных 

элементов а 1 , а г а п . Так как множество М, будучи бесконечным, не 

может исчерпываться этими элементами, то можно указать отличный от них 
элемент а„ +1 . Продолжая этот процесс, мы найдем вАІ бесконечное подмно- 
жество, составленное из элементов 

^1* ^2» • * • , • 

счетность этого подмножества очевидна. 

Лемма 2. Всякое бесконечное подмножество В счетного множества А 
само счетно. 

Множество А, ввиду его счетности, можно записать в виде 

«і. а 2 , ..., а п , ... (1) 

Пусть а кх будет первый элемент последовательности (1), принадлежащий 
к В, а ІІг — второй элемент с этим же свойством и т. д. Полагая а к ~=Ь п , 
п— 1, 2, ..., мы получаем, что элементы подмножества В составляют после- 
довательность 

^і» . . . , Ь п , . , , , 


т. е. это подмножество счетное. 
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Лемма 3. Объединение счетного множества конечных множеств, по- 
парно не имеющих общих элементов, есть счетное множество. 

Пусть, в самом деле, даны конечные множества 

■^ 1 » -^ 2 * ••• 

и пусть их объединение будет В. Мы пронумеруем, очевидно, все элементы 
множества В, если произвольным образом пронумеруем элементы конечного 
множества А ѵ затем продолжим эту нумерацию, перейдя к элементам мно- 
жества Л 2 , м т. Д- 

Лемма 4. Объединение двух счетных множеств, не имеющих общих 
элементов, есть счетное множество. 

Пусть даны счетные множества А с элементами 

°і> а 2> • • •> а п> • • • 

и В с элементами 

Ь\, й 2 > •••> 6 П> ••• 

и пусть объединение этих множеств будет С. Если мы положим 
а п ==с іп-і’ Ь п = с 2п , п= 1 , 2 

то все элементы множества С будут представлены в виде последовательности 

С 1> С 2> •••> с 1п-1’ с іп> •••> 

что и доказывает счетность этого множества. 

Докажем теперь следующую теорему: 

Множество всех алгебраических чисел счетно. 

Докажем предварительно счетность множества всех многочленов от од- 
ного неизвестного с целыми коэффициентами. Если 

1(х)^а 0 х п + а іХ п -'+ ... +а п _ іХ + а п 

— такой многочлен, притом отличный от нуля, то назовем высотой этого 
многочлена натуральное число 

й/=я + | По I + І°і I + ••• +1 о п _і ( + 1 о п |. 

Очевидно, что существует лишь конечное число целочисленных многочленов 
с данной высотой /г; обозначим это множество через М/,. Кроме того, через 
М 0 обозначим множество, состоящее нз одного нуля. Множество всех 
целочисленных многочленов будет объединением счетного множества конеч- 
ных множеств М 0 , М и М 2 , ..., М л , .... т. е,, по лемме 3, оно счеГно. 

Отсюда, по лемме 2, вытекает, что множество всех целочисленных 
примитивных неприводимых многочленов также счетно. Мы знаем, вместе 
с тем, что всякое алгебраическое число является корнем одного и только 
одного целочисленного примитивного неприводимого многочлена. Собирая, 
следовательно, корни всех таких многочленов, т. е. беря объединение счет- 
ного множества конечных множеств, мы получим множество всех алгебраи- 
ческих чисел; это множество будет, таким образом, ввиду леммы 3, счетным. 
Докажем, наконец, теорему: 

Множество всех трансцендентных чисел несчетно. 

Рассмотрим сначала множество Г всех действительных чисел х, распо- 
ложенных между нулем и единицей, 0<х<1, и докажем, что это мно- 
жество несчетно. Известно, что каждое из указанных чисел х можно за- 
писать в виде правильной бесконечной десятичной дроби 

х = 0, оцрц ... а п ... 

и что эта запись однозначна, если не допускать дробей, у которых для всех «, 
начиная с некоторого п = іѴ, все а П =9; обратно, всякая дробь указанного 
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вида равна некоторому числу х из множества Р. Предположим теперь, что 
множество Р счетно, т. е. что все числа * можно записать в виде после- 
довательности 


-*- 2 » •••> х к* 


( 2 ) 


Пусть 


х к~ 0> а кі а к, ••• а кп 


будет запись числа х к в виде бесконечной десятичной дроби. Напишем те- 
перь бесконечную десятичную дробь 

0 . ( 3 ) 

полагая р х отличным от первого десятичного знака дроби х 1г т. е. ^ ф <х 11 , 
р 2 — отличным от второго десятичного знака дроби х 2 . т. е. (3 2 Ф ос м , и, во- 
обще, р„ Ф а пп . Положим, кроме того, что среди цифр р„ бесконечно много 
отличных от цифры 9. Ясно, что существует дробь (3), удовлетворяющая 
всем этим требованиям. Она является, следовательно, числом из множества Р, 
но, по самому построению, отлична от всех чисел последовательности (2). 
Это противоречие доказывает несчетность множества Р. 

Отсюда следует несчетность множества всех комплексных чисел : 
если бы оно было счетным, то, ввиду леммы 2, оно не могло бы содержать 
несчетного подмножества Р. Несчетность множества всех трансцендентных 
чисел теперь, ввиду леммы 4, очевидна, так как объединение этого множе- 
ства со счетным множеством всех алгебраических чисел является множеством 
всех комплексных чисел, т. е. несчетно. 

Доказанные нами две теоремы показывают, ввиду леммы 1, что мно- 
жество трансцендентных чисел на самом деле является много более богатым 
элементами, т. е. более «мощным», чем множество алгебраических чисел 



ГЛАВА ТРИНАДЦАТАЯ 

НОРМАЛЬНАЯ ФОРМА МАТРИЦЫ 

§ 59. Эквивалентность Х-матриц 

Мы еще раз возвращаемся к вопросам, относящимся к линейной 
алгебре. Читатель уже при изучении гл. 7 убедился в том, какую 
важную роль играет понятие подобия матриц. Именно, две квад- 
ратные матрицы порядка п подобны тогда и только тогда, если 
они задают (в разных базах) одно и то же линейное преобразова- 
ние я-мерного линейного пространства. Мы пока не умеем, однако, 
отвечать на вопрос, подобны ли две данные конкретные матрицы 
или нет. С другой стороны, мы пока не умеем находить среди 
всех матриц, подобных данной матрице А, матрицу, имеющую 
в том или ином смысле простейший вид, и даже вопрос об усло- 
виях, при которых матрица А подобна диагональной матрице, был 
рассмотрен в § 33 лишь в одном частном случае. Именно эти 
вопросы будут рассматриваться в настоящей главе, причем сразу 
для случая произвольного основного поля Р. 

Займемся сначала изучением квадратных матриц порядка п, 
элементами которых служат многочлены произвольных степеней от 
одного неизвестного X с коэффициентами из поля Р. Такие мат- 
рицы называются многочленными матрицами, полиномиальными 
матрицами или, короче, "к- матрица ми. Примером ^.-матрицы слу- 
жит характеристическая матрица А — ХЕ произвольной квадратной 
матрицы А с элементами из поля Р; на главной диагонали этой 
матрицы стоят многочлены первой степени, вне главной диагонали — 
многочлены нулевой степени или нули. Всякая матрица с элемен- 
тами из поля Р — такие матрицы для краткости будем называть 
числовыми матрицами — также будет частным случаем ^-матрицы: 
ее элементы являются многочленами нулевой степени или нулями. 

Пусть дана ^.-матрица 


А(Х) = 


а п (X) • . • о 1п (X) 
п1 (к) ... а пп ( к ) 
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Назовем элементарными преобразованиями этой матрицы преоб- 
разования следующих четырех типов: 

1) умножение любой строки матрицы А (к) на любое число а 
из поля Р, отличное от нуля; 

2) умножение любого столбца матрицы А (к) на любое число а 
из поля Р, отличнее от нуля; 

3) прибавление к любой і- й строке матрицы А (к) любой ее 
у-й строки, у Ф і, притом умноженной на любой многочлен <р (X) 
из кольца Р[Х]; 

4) прибавление к любому г'-му столбцу матрицы А (к) любого 
ее у-го столбца, ]фі, притом умноженного на любой многочлен 
ф(Х) из кольца Р[Х]. 

Легко видеть, что для каждого из элементарных преобразо- 
ваний к-матрицы существует обратное преобразование, также 
являющееся элементарным. Так, обратным для преобразования 
1) будет элементарное преобразование, состоящее в умножении той 
же строки на число а -1 , существующее ввиду условия а Ф 0; 
обратным для преобразования 3) будет преобразование, состоящее 
в прибавлении к г'-й строке у-й строки, умноженной на — ср (X). 

В матрице А (к) можно при помощи нескольких элементар- 
ных преобразований переставить любые две строки или любые 
два столбца. 

Пусть, например, нужно переставить і- ю и у'-ю строки мат- 
рицы А (к). Это можно сделать при помощи четырех элементарных 
преобразований, как показывает следующая схема: 

'СМ7Ь(-М-<Н0- 

Здесь последовательно выполнялись такие преобразования: а) к ^-й 
строке прибавлялась у-я; б) из у-й строки вычиталась новая і- я; 
в) к новой 1-й строке прибавлялась новая у-я; г) новая у-я строка 
умножалась на — 1. 

Будем говорить, что Х-матрицы А (к) и В (к) эквивалентны и 
записывать это символом А {к) ~ В (к), если от матрицы А (к) можно 
перейти к матрице В {к) при помощи конечного числа элементар- 
ных преобразований. Это отношение эквивалентности является, 
очевидно, рефлексивным и транзитивным, а также и симметричным 
ввиду существования для каждого элементарного преобразования 
обратного элементарного преобразования. Иными словами, все 
квадратные к-матрицы порядка п над полем Р распадаются 
на непересекающиеся классы эквивалентных матриц. 

Нашей ближайшей целью является разыскание среди всех к- мат- 
риц, эквивалентных данной матрице А (X), матрицы по возможности 
простого вида. Для этого введем следующее понятие. Канониче- 
ской к-матрицей называется Х-матрица, обладающая следующими 
тремя свойствами: 
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а) эта матрица диагональная, т. е. имеет вид 



( 1 ) 


б) всякий -многочлен е { (Я), і= 2, 3, п, нацело делится на 

многочлен а,-., (X); 

в) старший коэффициент каждого многочлена е і {К), /= 1 , 

2, п , равен единице, если этот многочлен отличен от нуля. 

Заметим, что если среди многочленов е { (Я), стоящих на главной 
диагонали канонической Я-матрицы (1), встречаются равные нулю, 
то, ввиду свойства б), они непременно занимают на главной диа- 
гонали последние места. С другой стороны, если среди многочле- 
нов е { (X) встречаются многочлены нулевой Степени, то, по свойству 
в), все они равны 1 и, по свойству б), занимают на главной диа- 
гонали матрицы (1) первые места. 

К числу канонических Я-матриц принадлежат, в частности, не- 
которые числовые матрицы, в том числе матрицы единичная и ну- 
левая. 

Всякая 1-матрица эквивалентна некоторой канонической 
1-матрице, т. е., иными словами, она приводится элементар- 
ными преобразованиями к каноническому виду. 

Будем доказывать эту теорему индукцией по порядку п рас- 
сматриваемых Я-матриц. Действительно, при п— 1 будет 

Л(Я) = (а (Я)). 

Если а (Я) = 0, то наша матрица уже каноническая. Если же а (Я) ф 
4= 0, то достаточно разделить многочлен а (Я) на его старший 
коэффициент — это будет элементарное преобразование матрицы — и 
мы получим каноническую матрицу. 

Пусть теорема уже доказана для Я-матриц порядка п — 1. Рас" 
смотрим произвольную Я-матрицу А (Я) порядка п. Если она нуле- 
вая, то уже является канонической и доказывать нечего. Будем 
считать поэтому, что среди элементов матрицы Л (Я) имеются не- 
нулевые. 

Переставляя, если понадобится, строки и столбцы матрицы Л (Я), 
можно перевести один из ненулевых элементов в левый верхний 
угол. Таким образом, среди Я-матриц, эквивалентных матрице Л (Я), 
имеются такие, в левом верхнем углу которых стоит ненулевой 
многочлен. Рассмотрим все такие матрицы. Многочлены, стоящие 
в левом верхнем углу этих матриц, могут иметь разные степени. 
Степень многочлена является, однако, натуральным числом, а во 
всяком непустом множестве натуральных чисел существует наимень- 
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шее число. Можно найти, следовательно, среди всех ^.-матриц, экви- 
валентных матрице А (Я) и имеющих ненулевой элемент в левом 
верхнем углу, одну из таких, что многочлен, стоящий в ее левом 
верхнем углу, имеет наименьшую возможную степень. Деля, нако- 
нец, первую строку этой матрицы на старший коэффициент ука- 
занного многочлена, мы получим такую ^-матрицу, эквивалентную 
матрице А (Я), 

/ Й1 (к) Ь 12 (к) . . . Ь 1п (к) \ 

А(к^\ 1) ‘ 2ііХ) К -' г (Я) ’ ' ' Кп М | 

\ Ь п1 (Я) Ь пі (к) . . . Ь пп {к) ) 

что е 1 (Х)=^0, старший коэффициент этого многочлена равен 1 
и никакой комбинацией элементарных преобразо- 
ваний нельзя перейти от полученной матрицы 
к такой матрице, в левом верхнем углу которой 
стоял бы ненулевой многочлен меньшей степени. 

Докажем, что все элементы первой строки и первого столбца 
полученной матрицы нацело делятся на е г (к). Пусть, например, 
для 2 у =<: /г 

Ь 1/ (к) = е 1 (к)д(к) + г(к), 

где степень г (к) меньше степени е г (Я.), если г (к) отлично от нуля. 
Тогда, вычитая из у'-го столбца нашей матрицы ее первый столбец, 
умноженный на ^ {к), а затем переставляя первый и у'-й столбцы, 
мы придем к такой матрице, эквивалентной матрице А {к), в левом 
верхнем углу которой стоит многочлен г (к), т. е. многочлен мень- 
шей степени, чем е х (к), что противоречит выбору этого многочлена. 
Отсюда следует г(А.) = 0, что и требовалось доказать. 

Вычитая теперь из у'-го столбца нашей матрицы ее первый стол- 
бец, умноженный на д(к), мы заменим элемент (к) нулем. Делая 
такие преобразования для у = 2, 3, ..., п, мы заменим нулями все 
элементы Ь Х ] (к). Аналогичным путем заменяются нулями и все эле- 
менты Ь п (к), і — 2, 3, ...,п. Мы придем, следовательно, к такой 
матрице, эквивалентной матрице А (Л.), в левом верхнем углу 
которой стоит многочлен е г (к), а все остальные элементы пер- 
вой строки и первого столбца равны нулю, 

/ е 1 {к) 0 ... О \ 

л I О С 22 (А.) . . . С 2п (к) \ 


О с„ 2 (Я) ... с пп (к) 


По индуктивному предположению, матрица (п — 1)-го порядка, 
стоящая в правом нижнем углу полученной нами матрицы (2), 
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элементарными преобразованиями приводится к каноническому виду. 


С 22 (^) • • • С 2 


с п2 ( • • • С пп Ф“) 


* 2 (Ц О 


0 е п (Ху 

Совершив эти же преобразования над соответствующими строками 
н столбцами матрицы ( 2 ) — при этом первая строка и первый стол- 
бец этой матрицы останутся, очевидно, без изменения, — мы полу- 
чим, что ,е х (Я) О 

е 2 (^) 


А (к) 


( 3 ) 


0 е " {Х) 

Для доказательства того, что матрица (3) является канониче- 
ской, остается показать, что е 2 (А.) нацело делится на е г (X). Пусть 


е 2 [Х) = е 1 (Х) 9 (Х) + Г(Я), 

где г (А.) = 5 ^ О и степень г (X) меньше степени е 1 (X). Прибавляя, 
однако, ко второму столбцу матрицы (3) ее первый столбец, умно- 
женный на ^ (Я), а затем вычитая из второй строки первую строку, 
мы заменим элемент (А) элементом г (к). Переставляя, далее, 
первые две строки и первые два столбца, мы переместим много- 
член г (к) в левый верхний угол матрицѣ, что .противоречит, однако, 
выбору многочлена (Я). 

Теорема о приведении А-матрицы к каноническому виду дока- 
зана. Эта теорема должна быть дополнена следующей теоремой 
единственности: 

Всякая к-матрица эквивалентна лишь одной канонической 
матрице. 

В самом деле, пусть дана произвольная А-матрица А (к) по- 
рядка п. Фиксируем некоторое натуральное число к , 1 е^ке^п, 
и рассмотрим все миноры к - го порядка матрицы А (Я). Вычисляя 
эти миноры, мы получим конечную систему многочленов от к; 
наибольший общий делитель этой системы многочленов, взятый со 
старшим коэффициентом 1 , обозначим через З к (к). 

Мы имеем, следовательно, многочлены 


а,(к), а 2 (к), а п (к), (4) 

однозначно определяемые самой матрицей А (к). 
При этом й 1 (к) есть наибольший общий делитель всех элементов 
матрицы Л (А), взятый с коэффициентом 1, а й п (к) равен опреде- 
лителю матрицы Л (А.), деленному на его старший коэффициент. 
Заметим также, что если матрица Л (А.) имеет ранг г, то 

а г+1 (к) = ...=а п (к)= о, 

в то время как все остальные многочлены системы (4) отличны от нуля. 
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Наибольший общий делитель й к (X) всех миноров к-гр порядка 
Х-матрицы Л (А), к— 1 , 2, . . п, не меняется при выполнении 
в матрице А (X) элементарных преобразований. 

Это утверждение почти очевидно для того случая, когда в мат- 
рице Л (X) выполняется элементарное преобразование типа 1) или 2). 
Так, например, если /-я строка матрицы умножается на число а из 
поля Р, аф 0, то те миноры к - го порядка, через которые і- я строка 
проходит, будут умножаться на а ( все же остальные миноры 6-го 
порядка останутся без изменения. Однако при разыскании наиболь- 
шего общего делителя нескольких многочленов любые из этих мно- 
гочленов можно беспрепятственно умножать на отличные от нуля 
числа из поля Р. 

Рассмотрим теперь элементарные преобразования типа 3) или 4). 
Пусть, например, к і-Рі строке, матрицы А (X) прибавляется ее 
у-я строка, ]ф /, умноженная на многочлен ф (X); получающуюся 
после этого преобразования матрицу обозначим через А (X), а наи- 
больший общий делитель всех ее миноров 6-го порядка, взятый 
со старшим коэффициентом 1, — через й к (Х). Посмотрим, что про- 
исходит при указанном преобразовании с минорами 6-го порядка 
матрицы А (X). 

Ясно, что не будут меняться те миноры, через которые і - я строка 
не проходит. Не меняются и те миноры, через которые проходят 
как і- я, так и у- я строки, так как определитель не меняется от 
прибавления к одной его строке кратного другой его строки. 
Возьмем, наконец, любой из тех миноров 6-го порядка, через ко- 
торые проходит і- я строка, но не проходит /'-и; обозначим его 
через М. Соответствующий минор матрицы Л (X) можно представить, 
очевидно, как сумму минора /И и умноженного на ф (X) минора М' 
матрицы Л (X), получающегося из минора М заменой элементов 
і- й строки матрицы Л (X) соответствующими элементами ее /-й строки. 
Так как и /И, и М' делятся на й к (к), то и Л4 + ф (А) Л4' будет де- 
литься на й к (к). 

Из сказанного следует, что все миноры 6-го порядка матрицы 
Л (X) нацело делятся на й к (X), а поэтому и й к (к) делится на й к (к)- 
Так как, однако, для рассматриваемого элементарного преобразо- 
вания существует обратное элементарное преобразование того же 
типа, то и й ь {%) делится на сІ к (Х). Если же учесть, что старшие 
коэффициенты обоих этих многочленов равны 1, то й к (X) = й ь (А), 
что и требовалось доказать. 

Таким образом, всем Х-матрицам , эквивалентным матрице 
А (X), соответствует один и тот же набор многочленов (4). Это 
относится, в частности, к любой (если их несколько) канони- 
ческой матрице, эквивалентной Л (X). Пусть (3) будет одна из 
таких матриц. 
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Вычислим многочлен д к (Х), к = 1 , 2 ,..., п, пользуясь матри- 
цей (3). Ясно, что минор к - го порядка, стоящий в левом верхнем 
углу этой матрицы, равен произведению 

е 1 (к)е 2 (Х). . .е к (к). (5) 


Если, далее, мы берем в матрице (3) минор к- го порядка, стоящий 
в строках с номерами і 1 , і 2 , ..., і к , где / 1 <г 2 < ... <4, 

и в столбцах с теми же самыми номерами, то этот минор 
равен произведению і (Я) (Я) ... е ік (Я), которое делится на (5). 

Действительно, 1^7 і 1 и поэтому (Я) делится на е 1 (Я), 2 
и поэтому е і (Я) делится на е 2 (Я) и т. д. Наконец, если в матрице (3) 
взят мйнор к- го порядка, через который хотя бы для одного і про- 
ходит і- я строка этой матрицы, но не проходит ее і- й столбец, то 
этот минор содержит нулевую строку и поэтому равен нулю. 

Из сказанного следует, что произведение (5) и будет наиболь- 
шим общим делителем всех миноров к- го рорядка матрицы (3), 
а поэтому и исходной матрицы А (Я), 

4 М = е і М 4 М ••• к=\, 2, , п. (6) 

Теперь легко показать, что многочлены е к (Я), к— 1, 2, п, 

однозначным образом определяются самой матрицей А (Я). 
Пусть ранг этой матрицы равен г. Тогда, как мы знаем, 
а г Ск)фО, но 4+і (Я) = 0, а поэтому, ввиду (6), 4 +1 (Я) = 0. Отсюда, 
ввиду свойств канонической матрицы, вообще следует, что е с л и 
ранг г матрицы Л(Я) меньше п, то 

4+1 (^) “ 4 + 2 (^) = • • • “ 4і Р') = 0" (7) 


С другой стороны, для к ^ г из (6) следует, ввиду й к _ х (Я) ф 0, что 


4 (Ц = 


4 (Я) 
4-г (Я) ’ 


( 8 ) 


Этим заканчивается доказательство единственности канониче- 
ского вида Я-матрицы. Одновременно мы получили способ непо- 
средственного разыскания многочленов е А (Я), называемых инва- 
риантными множителями матрицы Л (Я). 

Пример. Привести к каноническому виду Я-натрицу 


Л(Я) =■■ 


/Я 3 — Я 2Я 2 \ 

\ Я 2 + 5Я ЗЯ )' 


Выполняя цепочку элементарных преобразований, получаем; 

1 „„ Ю 


Л (Я) 


Я 3 
Я 2 + 5Я 


і I*. 


4 - 


я 

о 


)-( 


■ к 3 - 


Я 2 — я 


3 3 

Я 2 + 5Я 

Я ^ 3 — 10 ^- 

к) \ о 


о 
я 

-зя о\ 
я 


я о 

О Я 3 — 10Я 2 - 


-зя 



§ 60] УННМОДУЛЯРНЫЕ А-МАТРНЦЫ 371 

С другой стороны, можно было бы непосредственно вычислить инва- 
риантные множители матрицы А (А). Именно, вычисляя наибольший общий 
делитель элементов этой матрицы, получаем: 

а 1 (Х)=е 1 (Х)~Х. 

Вычисляя же определитель матрицы А (к) и замечая, что его старший коэф- 
фициент равен 1, получаем: 

(А) = А 4 — 10А 3 — ЗА 2 , 

а поэтому 

в, (А) =ф-^== А 3 — 10А 2 - ЗА. 

<іі (а) 

§ 60. Унимодулярные А-матрицы. Связь подобия числовых 

матриц с эквивалентностью их характеристических матриц 

Из результатов предшествующего параграфа вытекает один кри- 
терий эквивалентности А-матриц, которому можно придать следую- 
щие две почти тождественные формулировки: 

Две Х-матрицы тогда и только тогда эквивалентны, если 
они приводятся к одному и тому же каноническому виду . 

Две А- матрицы тогда и только тогда эквивалентны, если 
они обладают одинаковыми инвариантными множителями. 

Выведем еще один критерий, имеющий уже иной характер. 

Мы знаем, что к числу канонических А-матриц принадлежит 
единичная матрица Е. Назовем А-матрицу И (А) унимодулярной, 
если она имеет матрицу Е своим каноническим видом, т. е. если 
все ее инвариантные множители равны единице. 

Х-матрица (/(А) тогда и только тогда унимодулярна, если 
ее определитель отличен от нуля, но не зависит от А, т. е. 
является отличным от нуля числом из основного поля Р. 

Действительно, если І1(Х)^-Е, то этим двум матрицам соот- 
ветствует один и тот же многочлен й п (Х). Однако для единичной 
матрицы й п (Х) — 1. Отсюда следует, что определитель матрицы I 1 (А), 
отличающийся от й п (А) лишь отличным от нуля числовым множи- 
телем, будет отличным от нуля числом из поля Р. Обратно, если 
определитель матрицы 11 (А) отличен от нуля и не зависит от А, то 
для этой матрицы многочлен й п {Х) будет равен 1, а поэтому, 
по (6) из предыдущего параграфа, все инвариантные множители е і {Х) 
матрицы І1 { А), 7—1, 2, ..., п, равны единице. 

Отсюда следует, что всякая невырожденная числовая матрица 
является унимодулярной Х-матрицей. Унимодулярная А-матрица 
может иметь, однако, очень сложный вид. Так, А-матрица 

( А А 3 + 5 \ 

ѴА 2 — А— 4 А 4 — А 3 — 4А 2 +5А — 5 ) 

унимодулярна, так как ее определитель равен 20, т. е. отличен от 
нуля и от А не зависит. 
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Из доказанной выше теоремы следует, что произведение уни- 
моду лярных Х-матрщ само унимодулярно — достаточно вспом- 
нить, что при умножении матриц их определители перемножаются. 

Х-матрица (Д(Х) тогда и только тогда унимодулярна, если для нее 
существует обратная матрица, также являющаяся Х-матрицей. 

Действительно, если дана невырожденная ^-матрица, то, разы- 
скивая обычным способом обратную матрицу, мы должны будем 
делить алгебраические дополнения к элементам данной матрицы на 
определитель этой матрицы, т. е. на некоторый многочлен от X. 
Поэтому в общем случае элементы обратной матрицы будут рацио- 
нальными дробями от X, а не многочленами от X, т. е. эта мат- 
рица не будет Х-м а т р и ц е й. Если же дана унимодулярная 
матрица, то делить алгебраические дополнения придется лишь на 
отличное от нуля число из поля Р, т. е. элементы обратной мат- 
рицы будут многочленами от X и поэтому обратная матрица сама 
будет Я,-матрицей. Обратно, если ^-матрица Ід (X) обладает обратной 
Я-матрицей І/~ 1 (Х), то определители этих ббеих матриц являются 
многочленами от X , их произведение равно 1, а поэтому оба опре- 
делителя должны быть многочленами нулевой степени. 

Из последнего замечания вытекает такое добавление к доказан- 
ной сейчас теореме: 

Х-матрица, обратная к унимодулярной Х-матрице, сама унимо- 
дулярна. 

Понятие унимодулярной матрицы используется в формулировке 
следующего нового критерия эквивалентности Х-м а т р и ц: 

Две Х-матрицы А (X) и В (X) порядка п тогда и только тогда 
эквивалентны, если существуют такие унимодулярные Х-матрицы 
!Д(Х) и V (X) того же порядка п, что 

В (Х) = 1Г(Х) А (X) Ѵ(Х). (1) 


Введем сначала следующее понятие, используемое при доказа- 
тельстве этого критерия. Назовем элементарной матрицей числовую 
(и, следовательно, Х-) матрицу 


О 


.а 

1 


(О, 


( 2 ) 


О 


отличающуюся от единичной матрицы лишь тем, что на некотором 
/- м месте главной диагонали, стоит произвольное число а 
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из поля Р, отличное от нуля. С другой 
также элементарной матрицей А-матрицу 


П 


. .. 1 . . .ср (А). . . (і), 


стороны, 


назовем 


( 3 ) 



отличающуюся от единичной матрицы лишь тем, что на пересече- 
нии 7- й строки и у'-го столбца, 1 ^77^7/2, І^у'^л, причем 7 ф у, 
стоит произвольный многочлен <р (А) из кольца Р[А]. 

Всякая элементарная матрица унимодулярна. В самом деле, опре- 
делитель матрицы (2) равен а, но, по условию, а^=0; определитель 
же матрицы (3) равен 1. 

Выполнение в Я - матрице А (%) любого элементарного преоб- 
разования равносильно умножению этой матрицы слева или справа 
на некоторую элементарную матрицу. 

Действительно, читатель без труда проверит справедливость 
следующих четырех утверждений: 1) умножение матрицы А (К) слева 
на матрицу (2) равносильно умножению 7-й строки матрицы А (А) на 
число а; 2) умножение матрицы А (Я) справа на матрицу (2) равно- 
сильно умножению 7-го столбца матрицы А (А.) на число а; 3) умноже- 
ние матрицы Л (А) слева на матрицу (3) равносильно прибавлению 
к 7-й строке матрицы А (А.) ее у'-й строки, умноженной на ср (А); 
4) умножение матрицы А (А) справа на матрицу (3) равносильно при- 
бавлению к у-му столбцу матрицы А (А) ее 7-го столбца, умножен- 
ного на ср (А). 

Перейдем теперь к доказательству нашего критерия 
эквивалентности А-матриц. Если А (А) В (А), то от А (А) 
можно перейти к В (А) при помощи конечного числа элементарных 
преобразований. Заменяя каждое из этих преобразований умножением 
слева или справа на элементарную матрицу, мы придем к равенству 

В (А) = (А) . . . и к (А) А (А) Ѵ г (А) . . . V, (А), (4) 


где все матрицы ІІ 1 (А), . . Ѵ к (А), Ѵ г (А), . . . , Ѵ 1 (А) элементарны и, 
следовательно, унимодулярны. Унимодулярными будут поэтому и 
матрицы 

Т/ (А) = 77, (А) ... ТУ, (А), ѵ (А) = (А) . . . Ѵ 1 (А), (5) 

являющиеся произведениями унимодулярных матриц, а равенство (4) 
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перепишется в виде (1). Заметим, что если, например, к — О, т. е. 
элементарные преобразования совершались лишь над столбцами, то 
полагаем просто ІІ(Х) — Е. 

Проведенная нами часть доказательства позволяет одновременно 
высказать следующее утверждение: 

Х-матрица тогда и только тогда унимодулярна, если она 
представима в виде произведения элементарных матриц. 

В самом деле, мы уже пользовались тем, что произведение эле- 
ментарных матриц унимодулярно. Обратно, если дана произвольная 
унимодулярная матрица ]Ѵ (X), то она эквивалентна единичной мат- 
рице Е. Применяя проведенное выше доказательство вместо матриц 
А (X) и В (Я) к матрицам Е и \Ѵ (Я), мы из (4) получим равенство 

№(Х) = и 1 (Х)...Ц к (Х)Ѵ 1 (Х)... 

т. е. матрица ]Ѵ (Я) оказалась представленной в виде произведения 
элементарных матриц. 

Теперь легко провести и доказательство обратного 
утвержде ни я нашего критерия. Пусть для матриц А (Я) и 
В (Я) существуют такие унимодулярные матрицы Ѵ (Я) и V (Я), что 
имеет место равенство (1). По доказанному, матрицы 7/(Я) и V (Я) 
можно представить в виде произведений элементарных матриц; пусть 
это будут представления (5). Равенство (1) перепишется теперь 
в виде (4) и, заменяя каждое умножение на элементарную матрицу 
соответствующим элементарным преобразованием, мы получим, нако- 
нец, что А (Я) — В (Я). 

Матричные многочлены. На понятие Я-матрицы можно посмот- 
реть с совершенно иной стороны. Назовем матричным Х-многочле- 
ном порядка п над полем Р многочлен от Я, коэффициентами 
которого служат квадратные матрицы одного и того же порядка п 
с элементами из поля Р; его общим видом будет 

А 0 Х к А^Х 4-1 А^^Х-у А к . (6) 

Понимая, в соответствии с § 15, умножение матрицы А і на 
Я*-', і — 0, 1 к, как умножение на Х к ~ 1 всех элементов 
матрицы А ( , а затем выполняя сложение матриц в .соответствии с тем 
же § 15, мы получим, что всякий матричный Х-многочлен порядка п 
можно записать в виде Х-матрицы порядка п. Так, 



4Я 3 + Я — ЗЯ 2 + 2Я + 1 \ 
—Я 3 Я 3 + Я 2 — 2Я ) ' 


Обратно, всякая Х-матрица порядка п может быть записана 
в виде матричного Х-многочлена порядка п. Так, 


/ЗЯ 2 — 5 Я+1 
\Я“ + 2Я —3 


С .>‘+(2 1 ) 


Я 2 - 


о 1 

2 О 


* + ( О 
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Соответствие между Я-матрицами и матричными Я-многочленами 
является взаимно однозначным и изоморфным в смысле § 46, Дей- 
ствительно, равенство Я-многочленов вида (6) как матриц равносильно 
равенству матричных коэффициентов при одинаковых степенях Я, 
а умножение матрицы на Я равносильно умножению ее на скалярную 
матрицу с Я на главной диагонали. 

Пусть дана Я-матрица А (Я), причем 

А (Я) = А 0 Х к Л 1 Я А_1 + . . . 

где матрица А 0 не является нулевой. Число к назовем степенью 
Я-матрицы А (Я); это будет, очевидно, наивысшая степень (по Я) 
элементов матрицы А (Я). 

Взгляд на Я-матрицы как на матричные многочлены позволяет 
развивать для Я-матриц теорию делимости, аналогичную теории 
делимости для числовых многочленов, но усложняемую, понятно, 
некоммутативностью умножения матриц и наличием делителей нуля. 
Мы ограничимся лишь вопросом об алгоритме деления 
с остатком. 

Пусть над полем Р даны X- матрицы порядка п 
А (Я) = Л 0 Я й + Л 1 Я А_1 + . . . + Л Й-1 Я + А к , 

В(Я) = ВДЧВ 1 Я г -Ч...+й і _ 1 Я+5„ 

причем предположим, что матрица В 0 невырожденная, т. е. 
существует матрица Во 1 . Тогда над полем Р можно найти 
такие Х-матрицы С} 1 (Я) и Р 1 (Я) того же порядка п, что 

А(Х) = В(Х)Я 1 {Х)+Р 1 (Х), (7) 

причем степень Р г {Х) меньше степени В{ Я) или же Д 1 (Я) = 0. 
С другой стороны, над полем Р можно найти такие Х-матрицы 
ф 2 (Я) и Р 2 (Я) порядка п, что 

Л(Я) = 3 2 (Я)В(Я)+/? 2 (Я), (8) 

причем степень Р 2 (Я) меньше степени В(Х) или же Д 2 (Я) = 0. 
Матрицы <2 г (Я) и Р г (Я), а также (? 2 (Я) и Р 2 (Я), удовлетворяющие 
этим условиям, определяются однозначно. 

Доказательство этой теоремы проходит так же, как доказатель- 
ство соответствующей теоремы для числовых многочленов (см. § 20). 
Пусть, например, условию (7) удовлетворяют также матрицы (З х (Я) 
и Р х (Я), причем степень Р х (Х) меньше степени В( Я). Тогда 

в (Я) [о, (Я) - (Я)] = р, (Я) - р г (Я). 

Степень правой части меньше /, степень же левой части, если 
квадратная скобка отлична от нуля, больше или равна /, так как 
матрица В 0 невырожденная. Отсюда следует единственность матриц 
(Я) и Р х (Я). 
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Для доказательства существования этих матриц заметим, что 
при к^І степень разности 

А(Х)~В(Х).В~ 1 А 0 Х к ~ 1 

будет строго меньше к; поэтому Во г А 0 Х к ~ 1 будет старшим членом 
матричного Х-многочлена (X). Дальше продолжается так же, как 
в § 20. С другой стороны, Степень разности 

А{Х)-~А 0 В~ в 1 Х к - 1 -В[Х) 

также строго меньше к, т. е. у 4 0 В^ 1 Х а_/ будет старшим членом 
матричного Х-многочлена <3 2 (X). Мы видим, что Х-матрицы (X) и 
(X) (а также (X) и Р 2 (X) ), удовлетворяющие условиям теоремы, 
действительно в общем случае будут различными. 

Основная теорема о подобии матриц. Как уже отмечалось, 
у нас нет пока способа для решения вопроса, подобны ли данные 
числовые матрицы А и В (т. е. матрицы с элементами из основного 
поля Р). С другой стороны, их характеристические матрицы А — ХЕ 
и В— ХЕ являются Х-матрицами и вопрос об эквивалентности этих 
матриц решается вполне эффективно. Легко понять поэтому, сколь 
велико значение следующей- теоремы: 

Матрицы А и В с элементами из поля Р тогда и только 
тогда подобны, если их характеристические матрицы А — ХЕ и 
В — ХЕ эквивалентны. 

В самом деле, пусть матрицы А н В подобны, т. е. над полем Р 
существует такая невырожденная матрица С, что 

В = С- 1 АС. 

Тогда 

С -1 {А — ХЕ) С= С- 1 АС—Х(С~ 1 ЕС) = В—ХЕ. 

Невырожденные числовые матрицы С -1 и С являются, однако, 
унимодулярными Х-матрицами, Мы видим, что матрица В — ХЕ 
получена умножением матрицы А — ХЕ слева и справа на унимоду- 
лярные матрицы, т. е. А — ХЕ^-В — ХЕ. 

Доказательство обратного утверждения является более сложным. 
Пусть 

А — ХЕ — В— ХЕ.. 

Тогда существуют такие унимодулярные матрицы Ц(Х) и V (X), что 
Ѵ(Х)(А — ХЕ)Ѵ(Х) = В— ХЕ. (9) 

Учитывая, что для унимодулярных матриц обратные матрицы суще- 
ствуют и являются Х-матрицами, выведем из (9) следующие равен- 
ства, используемые ниже: 

и{Х){А—ХЕ)~(В-ХЕ)Ѵ~ 1 (Х), 1 
(А-ХЕ)Ѵ(Х) = и~ 1 {Х)(В-ХЕ). ) 


(10) 
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Так как Х-матрица В — ХЕ имеет по X степень 1, причем стар- 
шим коэффициентом соответствующего матричного многочлена слу- 
жит -невырожденная матрица — Е, то к матрицам 7/(Х) и В — ХЕ 
можно применить алгоритм деления с остатком: существуют такие 
матрицы (X) и — последняя, если она отлична от нуля, должна 
иметь по X степень 0, т. е. от X не зависит, — что 

и(Х) = (в-ХЕ)<э 1 (Х) + я 1 . (11) 

Аналогично 

Ѵ(Х) = С1 2 (Х)(В-ХЕ)+К 2 . (12) 

Используя (11) и (12), из (9) получаем: 

/?! (А — ХЕ)Я 2 = (В- ХЕ) - Ц (X) [А — ХЕ) б? 2 (X) ( В— ХЕ) — 

—{В — ХЕ) (X) (А— ХЕ) Ѵ{Х) + {В—ХЕ) (X) (А — ХЕ) (X) (В — ХЕ) 

или, ввиду (10), 

Я^А-ХЕ) Я 2 = (В-ХЕ)-(В-ХЕ) Ѵ~ х (Х) С? 2 (Х)(В-ХЕ) — 

— {В -ХЕ) <?! (X) С/' 1 (X) {В -ХЕ) + 

+ (В- ХЕ) (X) (А - ХЕ) <3 2 (X) (В- ХЕ) = (В — ХЕ) X 
X {Е — [И -1 (Х)<3 2 (Х)+Я, (X) (Х)-^ (X) (А-ХЕ)(} а (X) ) (В-ХЕ)}. 

Квадратная скобка, стоящая справа, равна в действительности нулю: 
в противном случае она, являясь Х-матрицей, так как и Ѵ~ х (X), и 
Ѵ~ х (X) суть Х-матрицы, имела бы по меньшей мере степень 0, 
а тогда степень фигурной скобки была бы не меньше 1 и, следова- 
тельно, степень всей правой части была бы не меньше 2. Это, од- 
нако, невозможно, так как слева стоит Х-матрица степени 1. 

Таким образом, 

{А — ХЕ) Н 2 =В — ХЕ, 


откуда, приравнивая матричные коэффициенты при одинаковых 
степенях X, получаем 

ДИ#2 = Я, (13) 

Яі Я* = Е. (14) 

Равенство (14) показывает, что числовая матрица Я. 2 не только 
отлична от нуля, но даже является невырожденной, причем 

КГ 1 *#!, 

а тогда равенство (13) принимает вид 

К,"М/? 8 = В, 

что и доказывает подобие матриц А и В. 
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Одновременно мы научились находить ту невырож- 
денную матрицу которая трансформирует мат- 
рицу А в матрицу В. Именно, если матрицы А — ХЕ и В — ХЕ 
эквивалентны, то первая конечным числом элементарных преобра- 
зований переводится во вторую. Берем те из этих преобразований, 
которые относятся к столбцам, и произведение соответствующих 
элементарных матриц, взятых в том же порядке, обозначаем че- 
рез И (Я). Делим затем Ѵ(Х) на В — ХЕ, причем так, чтобы частное 
стояло слева от делителя (см. (8)). Остаток от этого деления 
и будет матрицей /? 2 . 

Указанное деление можно на самом деле не выполнять, а вос- 
пользоваться следующей леммой, которая найдет применение также 
в § 62: 

Лемм а. Пусть 

У(Ь)-У 0 ^+НД*-Ч-... + ^- г Я + П. Ѵ й фО. (15) 

Если 

Ѵ(Х) = (ХЕ-В)0 1 (Х)+К 1 , (16) 

И(Я) = 0 2 (Х)(ХЕ~В)+Я„ 

ГКО 

К 1 = В*Ѵ 0 + В‘~'Ѵ 1 + ...+ ВѴ 5 . Х + Ѵ„ (1 7) 

# 2 = Ко В^+Ѵ 1 В ! ~ 1 + ...+Ѵ І _ 1 В+Ѵ 5 . 

Достаточно доказать хотя бы первое из двух утверждений 
леммы — второе доказывается вполне аналогично. Доказательство 
состоит в непосредственной проверке справедливости равенства (16), 
если многочлен V (А.) будет заменен его записью (15), вместо 
будет подставлено (17), а в качестве ф х {X) будет взят многочлен 

Яі к<А* -1 + (ВѴ 0 + Ѵ х ) Х*~ 2 + ( В 2 Н 0 + ВѴ Х + Ѵ % ) х 5 -* + ... 

• . . + (В 5 - 1 Ѵ 0 -\-В 5 ~ 2 Ѵ 1 К ,_,). 

Проверка эта предоставляется читателю. 

Пример. Даны матрицы 



Их характеристические матрицы эквивалентны, так как приводятся к одному 
н тому же каноническому виду 


1 0 N 

о Я 2 — Я — бу ’ 


поэтому матрицы А и В подобны. 
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Для разыскания матрицы /? 2 , трансформирующей А в В, найдем какую- 
либо цепочку элементарных преобразований, переводящую А — ХЕ в В — ХЕ. 
Так, 


А —ХЕ - 


_/ — 2— Я 1 


-2-Х 1 8 + 4Х —4 

-16— 8Х П — Х) 16-8Х 11 — X 


40 + 4Х —4 
— 104 11— X 


-10-Х —4 


= В— ХЕ. 


К столбцам относятся два последних преобразования: к первому столбцу 
прибавляется второй, умноженный на — 8, а затем первый столбец умно- 
жается на — ^ . Произведение соответствующих элементарных матриц будет 


«-«-и ; 


-4 «V 


Эта матрица не зависит от X и поэтому она и будет искомой матрицей Х? 2 . 

Конечно, матрица, трансформирующая А в В, определяется далеко не 
однозначно. Такой будет, например, также матрица 



§ 61. Жорданова "нормальная форма 

Будем рассматривать сейчас квадратные матрицы порядка п 
с элементами из поля Р. Будет выделен один специальный тип таких 
матриц, так называемые жорданов ы матрицы, и будет показано, 
что эти матрицы служат нормальной формой для весьма широкого 
класса матриц. Именно, матрицы, все характеристические корни 
которых лежат в основном поле Р (и только такие матрицы), 
подобны некоторым жордановым матрицам, т. е., как говорят, 
они приводятся к жордановой нормальной форме. Отсюда будет 
следовать, если в качестве поля Р взято поле комплексных чисел, 
что всякая матрица с комплексными элементами приводится 
в поле комплексных чисел к жордановой нормальной, форме. 

Введем необходимые определения. Жордановой клеткой по- 
рядка к , относящейся к числу Х 0 , называется матрица порядка /с, 
имеющая вид 

х„ і 01 

х„ 1 

1 

,0 х 0 , 


(і) 
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иными словами, на ее главной диагонали стоит одно и то же 
число Х 0 из поля Р; параллель, ближайшая к главной диагонали 
сверху, сплошь занята числом 1; все остальные элементы матрицы 
равны нулю. Так, 



будут соответственно жордановыми клетками первого, второго 
и третьего порядков. 

Жордановой матрицей порядка п называется матрица порядка п, 
имеющая вид 



( 2 ) 


здесь вдоль главной диагонали идут жордановы клетки У 2 , . . . , 
некоторых порядков, не обязательно различных, относящиеся к неко- 
торым числам из поля Р, также не обязательно различным; все 
места вне этих клеток заняты нулями. При этом 5^1, т. е. одиа 
жорданова клетка порядка п принадлежит к числу жордановых 
матриц этого порядка, и, понятно, в^п. 

Заметим, хотя это и не будет дальше использоваться, что строе- 
ние жордановой матрицы можно было бы описать, не прибегая 
к понятию жордановой клетки. Очевидно, именно, что матрица ^ 
будет жордановой матрицей тогда и только тогда, если она имеет вид 


числа из поля Р, а каж- 
дое бу, і— 1 , 2, ..., п — 1 , равно единице или нулю, причем, 
если еу=1, то А,у=Ау +1 . 

Диагональные матрицы являются частным случаем жорда- 
новых матриц', это будут в точности те жордановы матрицы, 
у которых все жордановы клетки имеют порядок 1. 

Нашей ближайшей целью является разыскание канониче- 
ского вида для характеристической матрицы ХЕ 


' К 8 Х 0 

• е л-1 

о * X 

где і= 1, 2, , я, — произвольные 
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произвольной жордановой матрицы 7 порядка п. 
Найдем сначала канонический вид для характеристической матрицы 


А 0 — А, 


О 



( 3 ) 


одной жорданЬвой клетки (1) порядка к. Вычисляя определитель 
этой матрицы и вспоминая, что старший коэффициент многочлена 
й ь (к) должен равняться 1, получаем, что 

а к (і)^(х-х 0 ) к . 

С другой стороны, среди миноров (к — 1)-го порядка матрицы (3) 
имеется минор, равный единице, а именно тот, который получается 
после вычеркивания первого столбца и последней строки этой мат- 
рицы. Поэтому 

а к - 1 (*) = і- 

Отсюда следует, что каноническим видом для матрицы (3) служит 
следующая Х-матрица порядка к: 



Докажем теперь следующую л е м м у: 

Если многочлены (А), ф 2 (А), . . . ,ф 4 (А) из кольца Р[ А] попарно 
взаимно просты, то имеет место следующая эквивалентность : 


(<Рі (А) 0 


1 0' 

Фа (А) 


• 



’ 1 

. о <МА) / 


0 і 

ІЬ(А) 

«=1 


Достаточно, очевидно, рассмотреть случай і = 2. Так как много- 
члены ф х (А) и ф 2 (А) взаимно просты, то в кольце Р[ А] существуют 
такие многочлены и х (А) и ц 2 (А), что 

Ф Х (А) МА) + ф 2 (А) «2 М = 1 - 
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Поэтому 


/ <р 4 (Я) 0 \ /ф х (X) Фх (X) и 1 (X) \ 

\ 0 фг (X)) V 0' ф 2 (Я) ) 

/ Фх (Я.) фх (Я) «1 (Я) + ф 2 (Я) ц 2 (Я)\ __ /фх (Я) 
V О ф 2 (Я) ) V 0 

I 1 Фі(Я)\ /1 К 

ІФа (Я) О у - \0 — Фі (Я) фа (Я ) ) 



0 иг 1 

-Фх (Я) ф 2 (Я)У ѴО 


0 ^ 

Фх (Я) Фа (Я) у’ 



что и требовалось доказать. 

Перейдем теперь к рассмотрению характеристической матрицы 



для жордановой матрицы ^ вида (2); здесь Е { , і — 1, 2, , ,,, 5. 
есть единичная матрица того же порядка, что и клетка ) { . Пусть 
жордановы клетки матрицы ^ относятся к следующим различным 
числам: Я х , Я 2 , ... , Х и где Пусть, далее, к числу Я,-, / = 1, 

2, . . . , і, относится д і жордановых клеток, д 1 • ^ 1, и пусть порядки 
этих клеток, расположенные в невозрастающем порядке, будут 

Ь{1 ^ ^/2 ^'Чі 1 (Щ 

Отметим, хотя и не будем этим пользоваться, что 

і 

2 9і — 8 > 

1-1 

і <П 

2 2 а 7 =л - 

г=і /=і 

Применяя элементарные преобразования к тем строкам и столб- 
цам матрицы (5), которые проходят через клетку — \Е І этой 
матрицы, мы не будем затрагивать, очевидно, других диагональных 
клеток. Отсюда следует, что в матрице (5) можно при помощи эле- 
ментарных преобразований заменить каждую клетку / г — ЯЯ ; , 
і = 1,2, . . , , х, соответствующей клеткой вида (4). Иными словами, 
матрица ^ — ХЕ эквивалентна диагональной матрице, на диаго- 
нали которой стоят, помимо некоторого числа единиц, также 




УКОРДАНОВА НОРМАЛЬНАЯ ФОРМА 


383 


§ 611 

следующие многочлены, соответствующие всем жордановым 
клеткам матрицы У: 

(Ь-К) к ", , (X — 

(А.— *,)»«, (А,— Ь,)*», (Х-Х 2 ) к ч>, 

(Х~Х,)\ (А,-А,)Ч .... (А-^)Ѵ 

Мы не указываем при этом те места на диагонали, на которых стоят 
многочлены (7), так как в любой диагональной ^-матрице диаго- 
нальные элементы можно произвольно переставлять при помощи 
перестановок строк и одноименных Столбцов. Это замечание сле- 
дует учитывать и в дальнейшем. 

Пусть <7 — наибольшее среди чисел і— 1, 2, . . . , і. Обозна- 
чим через е п _/ +1 (X) произведение многочленов, стоящих в у-м 
столбце таблицы (7)., у = 1 , 2, д, т. е. 

е пЧ+1 (Х)^Іі(Х-Х і )^ (8) 

і=і 

если при этом в /-м столбце имеются пустые места-— для некото- 
рых і может оказаться, что д { < у, — то соответствующие множи- 
тели в (8) считаем равными единице. Так как числа Х х , Х 2 , . . , , Х ( 
по условию различные, то степени линейных двучленов, стоящие 
в у-м столбце таблицы (7), попарно взаимно просты. Поэтому, на 
основании доказанной выше леммы, они при помощи элементарных 
преобразований могут быть заменены в рассматриваемой диагональ- 
ной матрице их произведением е п _ ; - +1 (X) и некоторым числом единиц. 
Проделав это для у— 1, 2, . д, мы получим, что 



О 1 


У— ХЕ ~~ < 


+ 1 


(А.) 


е п -і (X) 

О е п (Х) 


( 9 ) 


Это и будет искомый канонический вид матрицы У — ХЕ, Дей- 
ствительно, старшие коэффициенты всех многочленов, стоящих в (9) 
на главной диагонали, равны единице и каждый из этих много- 
членов нацело делится на предыдущий ввиду условия (6). 
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Пример. Пусть 



2 

1 

0 


0 

2 

1 


0 

0 

2 


2-^ 


5 1 

0 5 




0 

I 

| 

5 1 

0 5 

1 

■ 



1 

2 


Для этой жордановой матрицы 9-го порядка таблица многочленов (7) имеет 
вид ' 

(Х—2) 3 , Х—2, X— 2, 

(X— 5)\ (X — 5) 2 . 

Поэтому инвариантными множителями матрицы ] будут многочлены 

е в (Х)=(Х-2) 3 (Х-5) 3 , 
е 3 (Х) = (Х-2) (Х-5)\ 
е 7 (Х) = Х-2, 

в то время как е в {Х)= . . . =е х (Я)= і. 


Теперь, когда мы научились по виду данной жордановой ма- 
трицы У сразу писать канонический вид ее характеристической 
матрицы, может быть доказана следующая теорема: 

Две жордановы матрицы тогда и только тогда подобны, 
если они состоят из одних и тех же жордановых клеток, 
т. е. отличаются, быть может, лишь расположением этих 
клеток вдоль главной диагонали. 

В самом деле, таблица многочленов (7) полностью определялась 
набором жордановых клеток жордановой матрицы У и в ней никак 
не отражалось расположение жордановых клеток вдоль главной 
диагонали этой матрицы. Отсюда следует, что если жордановы 
матрицы У и У' обладают одним и тем же набором жордановых 
клеток, то им соответствует одна и та же таблица многочленов (7), 
а поэтому одни и те же многочлены (8). Таким образом, характери- 
стические матрицы У — ХЕ и У' — ХЕ обладают одинаковыми инва- 
риантными множителями, т. е. эквивалентны, а поэтому сами ма- 
трицы У и У' подобны. 
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Обратно, если жордановы матрицы У и У' подобны, то их харак- 
теристические матрицы обладают одинаковыми инвариантными мно- 
жителями. Пусть многочлены (8) для у = 1 , 2, д будут те из 

этих инвариантных множителей, которые отличны от единицы. Однако 
по многочленам (8) восстанавливается таблица многочленов (7). 
Именно, многочлены (8) разлагаются в произведение степеней линей- 
ных множителей, так как этим свойством обладают, как уже дока- 
зано, инвариантные множители характеристической матрицы для 
любой жордановой матрицы. Таблица (7) как раз и состоит из всех 
тех максимальных степеней линейных множителей, на которые раз- 
лагаются многочлены (8). Наконец, по таблице (7) восстанавливаются 
жордановы клетки исходных жордановых матриц: каждому много- 
члену (X — Я,-)*У из таблицы (7) соответствует жбрданова клетка 
порядка к ( - ■, относящаяся к числу А ; . Этим доказано, что матрицы У 
и У' состоят из одних и тех же жордановых клеток и отличаются, 
быть может, лишь их расположением. 

Из этой теоремы следует, в частности, что жорданоза матрица, 
подобная диагональной матрице, сама диагоналъна и что две 
диагональные матрицы тогда и только тогда подобны, если 
получаются друг из друга перестановкой чисел, стоящих на 
главной диагонали. 

Приведение матрицы к жордановой нормальной форме. 

Если матрица А с элементами из поля Р приводится к жор- 
дановой нормальной форме, т. е. подобна жордановой ма- 
трице, то, как следует из доказанной выше теоремы, жорданоза 
нормальная форма определяется для матрицы А однозначно 
с точностью до расположения жордановых клеток на главной 
диагонали. Условие для того, чтобы матрица А допускала такое 
приведение, указывается в следующей теореме, доказательство кото- 
рой дает одновременно практический способ для разыскания жорда- 
новой матрицы, подобной матрице А, если такая жорданова матрица 
существует. При этом заметим, что приводимость в поле Р 
означает, что все элементы трансформирующей матрицы содержатся 
в поле Р. 

Матрица А с элементами из поля Р тогда и только тогда 
приводится в поле Р к жордановой нормальной форме, если все 
характеристические корни матрицы А лежат в самом основ- 
ном поле Р. 

В самом деле, если матрица А подобна жордановой матрице У, 
то эти две матрицы обладают одними и теми же характеристиче- 
скими корнями. Характеристические корни матрицы У находятся, 
однако, без всяких затруднений: так как определитель матрицы У — ХЕ 
равен произведению ее элементов, стоящих на главной диагонали, 
то многочлен |У — ХЕ | разлагается над полем Р на линейные мно- 
жители и его корнями служат числа, стоящие на главной диагонали 
матрицы У, и только они. 
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Обратно, пусть все характеристические корни матрицы А лежат 
в самом поле Р. Если отличные от 1 инвариантные множители 
матрицы А — ХЕ будут 

е п-д+ іМ> •••> е п- і(*). е а (Х), (10) 

то 

I А- ХЕ і = (- 1)" е п _ д+г (X) . . . (Я) е п (X). 

Действительно, определители матрицы А — ХЕ и ее канонической 
матрицы могут отличаться друг от друга лишь постоянным множи- 
телем, который на самом деле равен ( — 1)", так как именно таков 
старший коэффициент характеристического многочлена | А — Я7:|. 
Таким образом, среди многочленов (ГО) нет равных нулю, сумма 
степеней этих многочленов равна п и все они разлагаются над 
полем Р на линейные множители — последнее ввиду того, что, по 
условию, многочлен | А — ХЕ\ обладает таким разложением. 

Пусть (8) будут разложения многочленов (10) в произведения 
степеней линейных множителей. Назовем элементарными делите- 
лями многочлена е - +1 , /=1, 2, . . . , д, отличные от единицы 
степени различных линейных двучленов, входящие в его разложе- 
ние (8), т. е. 

(Х — Х^ч, (Я — Я 2 )*»/, (Я — Я*)*м. 

Элементарные делители всех многочленов (10) назовем элементар- 
ными делителями матрицы А и выпишем их в виде таблицы (7). 

Возьмем теперь жорданову матрицу У порядка п, составленную 
из жордановых клеток, определяемых следующим образом: каждому 
элементарному делителю (Я — Х : ) к и матрицы Л ставим 
в соответствие жордановуклетку порядка отно- 
сящуюся к числу Я г . Очевидно, что отличными от 1 инвариант- 
ными множителями матрицы У — ХЕ будут многочлены (10) и только 
они. Поэтому матрицы А — ХЕ и У — ХЕ эквивалентны и, следова- 
тельно, матрица А подобна жордановой матрице У. 

Пример. Пусть дана матрица 

/—16 —17 87 — 108\ 

8 9 -42 54 \ ' 

л -1 — 3 — 3 16 —18 Г 

\ — 1 — 1 6 —8/ 

Приводя обычным способом матрицу А — ХЕ к каноническому виду, полу- 
чим, что отличными от единицы инвариантными множителями "этой матрицы 
будут многочлены 

МЯ) = (Я-1) г (Х + 2), 
е 3 (Х) = Х — 1. 

Мы видим, что матрица А приводится к жордановой нормальной форме далее 
в поле рациональных чисел. Ее элементарными делителями являются много- 
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члены (Я — I) 2 , X — 1 и Я + 2, а поэтому жордановой нормальной формой 
матрицы А служит матрица 


/1 і О 
/010 
ІО О 1 
\0 о о 



Если бы мы хотели найти ту невырожденную матрицу, которая транс- 
формирует матрицу А в матрицу то должны были бы воспользоваться 
указаниями, сделанными в конце предшествующего параграфа. 

На основании предшествующих результатов может быть дока- 
зано, наконец, следующее необходимое и достаточное 
условие приводимости матрицы к диагональному 
виду, условие, из которого немедленно вытекает достаточный кри- 
терий приводимости к диагональному виду, доказанный в § 33. 

Матрица А порядка п с элементами из поля Р тогда и 
только тогда приводится к диагональному виду, если все корни 
последнего инвариантного множителя е п (Я) ее характеристиче- 
ской матрицы лежат в поле Р, причем среди этих корней нет 
кратных. 

В самом деле, приводимость матрицы к диагональному виду 
равносильна приводимости к такому жорданову виду, все жордановы 
клетки которого имеют порядок 1. Иными словами, все элементар- 
ные делители матрицы Л должны быть многочленами первой степени. 
Так как, однако, все инвариантные множители матрицы А — ХЕ 
являются делителями многочлена е п (X), то последнее условие равно- 
сильно тому, что все элементарные делители многочлена е п (Х) имеют 
степень 1, что и требовалось доказать. 


§ 62. Минимальный многочлен 

Пусть дана квадратная матрица А порядка п с элементами из 
поля Р. Если 

/(Я)=а 0 Х* +а 1 Я*- 1 + . , . + а к _ 1 Х + а к 
— произвольный многочлен из кольца Р[А], то матрица 
/ (Л) = а 0 А к + сс х А ' к - 1 + . . . + а к _ г А + а к Е 

будет называться значением многочлена /(X) при Х = А\ обращаем 
внимание на то, что свободный член многочлена /(X) умножается 
при этом на нулевую степень матрицы Л, т. е. на единичную ма- 
трицу Е. 

Легко проверяется, что если 

/(Я) = ф(Я) + ^(Я) 


или 


/(Х) = и(Х)ѵ(Х К 
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то 

/(Л) = Ф (Л) + ф(Л) 

и, соответственно, 

/(А) = и(А)ѵ(А). 

Если многочлен /(Я) аннулируется матрицей А, т. е. 

/(Л) = 0, 

то матрицу А будем называть матричным корнем или, там, где 
это не может вызвать недоразумений, просто корнем многочлена /(Я). 

Всякая матрица А служит корнем некоторого ненулевого 
многочлена. 

Мы знаем, в самом деле, что все квадратные матрицы порядка п 
составляют над полем Р л 2 -мерное векторное пространство. Отсюда 
следует, что система л 2 + 1 матриц 

Л” 2 , Л и2 -Ч ... , А, Е 

линейно зависима над полем Я, т. е. в Я существуют такие элементы 
а д , а 1 , ... , а п *, <ѵ +1 , не все равные нулю, что 

«о А" г + а 1 А пг - 1 + . . . +а„»Л-{-<ѵ +1 Е=0. 

Таким образом, матрица А оказалась корнем ненулевого многочлена 

Ф (Я) = а 0 Я" 2 + а г Я п3-1 + . . . + а„»Я + а„» +1 , 

степень которого не превосходит л 2 . 

Матрица А служит корнем и для некоторых таких многочленов, 
старшие коэффициенты которых равны единице — достаточно взять 
любой ненулевой многочлен, аннулируемый матрицей А, и разделить 
этот многочлен на его старший коэффициент. Многочлен наименьшей 
степени со старшим коэффициентом 1, аннулируемый матрицей А, 
называется минимальным многочленом матрицы А. Заметим, 
что минимальный многочлен матрицы А определен одно- 
значно, так как разность двух таких многочленов имела бы мень- 
шую степень, чем каждый из них, но также аннулировалась бы 
'матрицей А. 

Всякий многочлен /(Я), аннулируемый матрицей А, делится 
нацело на минимальный многочлен т{\) этой матрицы. 

В самом деле, если 

/(Я) = т (Я) (Я) + г (Я), 

где степень г (Я) меньше степени т (Я), то 

/(Л) = /я(Л)<7(Л) + г(Л) 

и из /(Л) = лг(Л) = 0 следует г(Л) = 0, что противоречит опреде- 
лению минимального многочлена. 
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Докажем теперь следующую теорему: 

Минимальный многочлен матрицы А совпадает с последним 
инвариантным множителем е п (Я) характеристической мат- 
рицы А — ХЕ. 

Доказательство. Сохраняя обозначения и используя резуль- 
таты § 59, можно написать равенство 

(_1)»| А-ХЕ\ = <1 а _ г (Х)е п (Х). (1) 

Отсюда следует, в частности, что многочлены е„(Я) и й п _ х {Х) не 
будут нулевыми. Обозначим, далее, через В(Х) присоединенную 
матрицу к матрице А — ХЕ (см. § 14), 

В(Х) = (А — ХЕ)*. 

Как вытекает из § 14, равенство (3), справедливо равенство 

{А — ХЕ) В(Х) = \А — ХЕ\ Е. (2) 

С другой стороны, так как элементами матрицы В(Х) служат взя- 
тые со знаками плюс или минус миноры (п — 1)-го порядка мат- 
рицы А — ХЕ и только они, а многочлен й п . х (Я) есть общий наибольший 
делитель всёх этих миноров, то 

в(Х) = а п . 1 (Х)С(Х), (3) 

причем наибольший общий делитель элементов мат- 
рицы С (Я) равен 1. 

Из равенств (2), (3) и (1) вытекает равенство 

(А - ХЕ) а п _ х (Я) с (Я) = (- 1 Г а п _ х (Я) (Я) е. 

Это равенство можно сократить на ненулевой множитель й п _ х {Х), 
как вытекает из следующего общего замечания: если <р (Я) — ненуле- 
вой многочлен, Ю(Х) = (сІ іі ( Я)) — ненулевая Я-матрица, причем 
пусть Я) = 7 ^= 0 , то в матрице ф(Я)І)(Я) на месте (5, і) будет стоять 
отличный от нуля элемент ф(Я)^ 5< (Я). Таким образом, 

(А — ХЕ) С(Я) = ( — 1 ) п е п (Я) Е, 

откуда 

е п (Я) (ХЕ — Л) [( — 1)” +1 С (Я)]. (4) 

Это равенство показывает, что остаток от «левого» деления 
Я-матрицы, стоящей слева, на двучлен ХЕ — А равен нулю. Из леммы, 
доказанной в конце § 60, вытекает, однако, что этот остаток равен 
матрице е п (А) Е<= е п (Л). Действительно, матрица е п (Х)Е может быть 
записана как матричный Я-многочлен, коэффициенты которого 
являются скалярными матрицами, т. е. перестановочны с матрицей А. 
Таким образом 


е п (А)= 0, 
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т. е. многочлен е п (Х) действительно аннулируется 
матрицей А. 

Отсюда следует, что многочлен е п (X) нацело делится на мини- 
мальный многочлен т (Я) матрицы А, 

е п Ск) = т(Х)д(к). (5) 

Ясно, что старший коэффициент многочленад(1)равен 
единице. 

Так как т(А) = 0, то снова, ввиду той же леммы из § 60, 
остаток от левого деления Я-матрицы т(Х)Е на двучлен ХЕ — А 
равен нулю, т. е. 

т(Х)Е = (ХЕ—А)<Э(Х). (6) 

Равенства (5), (4) и (6) приводят к равенству 

(ХЕ — А) [( — 1)" +1 С (X)) = (ХЕ -А) [О (X) д (Я)]. 

Обе части этого равенства можно сократить на общий множи- 
тель ХЕ — А, так как старший коэффициент Е этого матричного 
Я-многочлена является невырожденной матрицей. Таким образом, 

С(Я) = (-1)" + 10(Я)9(Я). 

Мы помним, однако, что наибольший общий делитель элементов 
матрицы С (Я) равен 1. Поэтому многочлен <7 (Я) должен иметь ну- 
левую степень, а так как его старший коэффициент равен 1, то 
</(Я)**=1. Таким образом, ввиду (5), 

е п (Я) = т (Я), 

что и требовалось доказать. 

Так как, ввиду (1), характеристический многочлен матрицы А 
нацело делится на многочлен е п (Х), то из доказанной сейчас теоремы 
вытекает следующая 

Теорема Гамильтона — К эли. Всякая матрица является 
корнем своего характеристического многочлена. 

Минимальный многочлен линейного преобразования. Докажем 
сначала следующее утверждение: 

Если матрицы А 'и В подобны и если многочлен /(Я) анну- 
лируется матрицей А, то он аннулируется и матрицей В. 
Действительно, пусть 

В=С'МС. 

Если 

/ (X) — а 0 Х к -\-а х Х к ~ х . . . -\-а к _ х Х -(- а к , 
то 

<%()А к -{- а х А к ос к _ х А сС/уЕ — 0. 
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Трансформируя обе части этого равенства матрицей С, получаем: 
С' 1 (а 0 Л* + а 1 А к ~ 1 + . . . +а к _ 1 А + а ІІ Е) С = 

= а 0 (С-МС^ + ві (С-МС^'Ч. .. + а,. 1 (С-МС)+о*Е* 

= а 0 В к + а 1 В к - 1 + . . . +а*_ 1 В+а А Е=0, 

т. е. /(5) = 0. 

Отсюда следует, что подобные матрицы обладают одним и тем 
же минимальным многочленом. 

Пусть теперь ср будет линейное преобразование л-мерного линей- 
ного пространства над полем Р. Матрицы, задающие это преобра- 
зование в разных базах пространства, подобны между собой. Общий 
минимальный многочлен этих матриц называется минимальным мно- 
гочленом линейного преобразования ср. 

Используя операции над линейными преобразованиями, введен- 
ные в § 32, можно ввести понятие значения многочлена 

/(Я) = а 0 Я 6 + а 1 Л А " 1 + . . . +а*_А + а* 

из кольца Р[Я] при Я, равном линейному преобразованию ср: это 
будет линейное преобразование 

/(<р) = а 0 (р*+а 1 ф А - 1 + . . . +а*_ 1 ср + а А е, 

где е — тождественное преобразование. 

Мы скажем, далее, что многочлен /(Я) аннулируется линейным 
преобразованием <р, если 

/(ф) = ю, 

где со — нулевое преобразование. 

Учитывая связь между операциями над- линейными преобразова- 
ниями и над матрицами, читатель без труда докажет, что мини- 
мальный многочлен линейного преобразования <р является тем 
однозначно определенным многочленом наименьшей степени со 
старшим коэффициентом 1, который аннулируется преобразо- 
ванием ф. После этого результаты, полученные выше, в частности 
теорема Гамильтона — Кэли, могут быть переформулированы на 
языке линейных преобразований. 



ГЛАВА ЧЕТЫРНАДЦАТАЯ 

ГРУППЫ 

§. 63. Определение и примеры групп 

Кольца и поля, игравшие столь большую роль в предшествующих 
главах, являются алгебраическими системами с двумя независимыми 
операциями: сложением и умножением. В различных отделах матема- 
тики и в ее приложениях весьма часто встречаются, однако, и такие 
алгебраические системы, в которых определена лишь одна алгебраи- 
ческая операция. Так, ограничиваясь пока примерами, уже появляв- 
шимися в нашей книге, отметим, что в множестве подстановок п - й 
степени (см. § 3) нами была определена лишь одна операция — ум- 
ножение. С другой стороны, в определение векторного простран- 
ства (§ 8) входит сложение векторов, в то время как умножение 
векторов не было нами определено (заметим, что умножение вектора 
на число не удовлетворяет данному в § 44 определению алгебраи- 
ческой операции). 

Важнейшим типом алгебраических систем с одной операцией 
являются группы. Это понятие обладает чрезвычайно широкой об- 
ластью применений и служит предметом большой самостоятельной 
науки — теории групп. Настоящая глава может рассматриваться как 
введение в теорию групп — в ней будут изложены элементарные све- 
дения о группах* знакомство с которыми необходимо каждому ма- 
тематику; закончится глава одной менее элементарной теоремой. 

Условимся, как это принято в общей теории групп, называть 
рассматриваемую алгебраическую операцию умножением и упо- 
треблять соответствующую символику. Напомним (см. § 44), что 
алгебраическая операция предполагается всегда 
выполнимой и однозначной — для любых двух элементов 
а и Ь рассматриваемого множества произведение аЬ существует 
и является однозначно определенным элементом этого множества. 

Группой называется множество О с одной алгебраической опера- 
цией, ассоциативной (хотя не обязательно коммутативной), причем 
для этой операции должна существовать обратная операция. 

При этом, ввиду возможной некоммутативности групповой опе- 
рации, выполнимость обратной операции означает следующее: для 
любых двух элементов а и Ь из О существуют в О такой одно- 
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значно определенный элемент х и такой однозначно 
определенный элементу, что 

ах — Ь,уа = Ь. 

Если группа О состоит из конечного числа элементов, то она 
называется конечной группой, а число элементов в ней — -порядком 
группы. Если операция, определенная в группе О, коммутативна, 
то О называется коммутативной или абелевой группой. 

Укажем простейшие следствия из определения группы. На осно- 
вании рассуждений, уже проводившихся в § 44, можно утверждать, 
что закон ассоциативности позволяет говорить однозначным обра- 
зом о произведении любого конечного числа элементов группы, 
заданных (ввиду возможной некоммутативности групповой операции) 
в определенном порядке. 

Переходим к следствиям из существования обратной операции. 

Пусть в группе О дан произвольный элемент а. Из определения 
группы вытекает существование в О такого однозначно определен- 
ного элемента е а , что ае а — а\ этот элемент играет, следовательно, 
роль единицы при умножении на него элемента а справа. Если Ь — 
любой другой элемент группы О и если у есть элемент группы, 
удовлетворяющий равенству уа — Ь, — его существование следует 
из определения группы, — то мы получим: 

Ь —уа = у (ое а ) = {у а) е а = Ъе а . 

Таким образом, элемент е а играет роль правой единицы по отно- 
шению ко всем элементам группы О, а не только по отношению 
к исходному элементу а; поэтому мы его обозначим через е' . Из 
однозначности, входящей в определение обратной операции, выте- 
кает единственность этого элемента. 

Таким же путем можно доказать существование и единствен- 
ность в группе О элемента е" , удовлетворяющего условию е"а—а 
для всех а из О. На самом деле элементы е' и е" совпадают, так 
как из равенств е"е' = е" и е"е' — е' вытекает е" — е'. Этим дока- 
зано, что во всякой группе О существует однозначно определен- 
ный элемент е, удовлетворяющий условию 

ае — еа — а 

для всех а из О. Этот элемент называется единицей группы О и 
обычно обозначается символом 1 . 

Из определения группы вытекает, далее, существование и един- 
ственность' для данного элемента а таких элементов а' и а", что 

аа' = 1 , а" а = 1 . 

В действительности элементы а' и а" совпадают: из равенств 
а”аа' =а" {аа') = а"-\= а", 
а”аа' = {а" а) а' =* 1 • а' — а' 
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следует а" = а' . Этот элемент называется обратным элементу а и 
обозначается а" 1 , т. е. 

аа~ х = а~ г а = 1 . 

Таким образом, всякий элемент группы обладает однозначно опре- 
деленным обратным элементом. 

Из последних равенств вытекает, что обратным элементом для 
элемента а~ х служит сам элемент а. Легко видеть, далее, что обрат- 
ным для произведения нескольких элементов будет произведение 
элементов, обратных сомножителям и притом взятых в обратном 
порядке: 

Ка 2 . ..а п _ 1 а п )- 1 = а„ 1 а~1 1 . . . а^а^ 1 . 

Наконец, обратным элементом для единицы будет сама единица. 
Проверка того, является ли группой данное множество с одной 
операцией, весьма облегчается тем, что в определении группы требо- 
вание выполнимости обратной операции можно заменить предполо- 
жением о существовании единицы и обратных элементов, причем 
лишь с одной стороны (например, правой) и без предположения об 
их единственности. Это вытекает из следующей теоремы: 

Множество О с одной ассоциативной операцией будет груп- 
пой, если в О существует хотя бы один элемент е, обладающий 
свойством 

ае—а для всех а из О, 

и если среди этих правых единичных элементов существует 
хотя бы один такой элемент е 0 , что по отношению к нему 
всякий элемент а из О обладает хотя бы одним правым обрат- 
ным элементом а -1 : 

аа~ х — е 0 . 

Доказательство. Пусть а~ г — один из правых обратных 
элементов для а. Тогда 

аа~ х — е 0 — е 0 е 0 = е 0 аа~ х , 

т. е. аа~ х = еоаа~ х . Умножая обе части этого равенства справа на 
один из элементов, правых обратных для а -1 , мы получим ае 0 = е 0 ае 0} 
откуда а — е 0 а, так как е 0 — правая единица для О. Таким образом, 
элемент е 0 оказывается и левой единицей для О. Если теперь е г 
есть произвольная правая единица, е 2 — произвольная левая единица, 
то из равенств 

е 2 е 1 ~ е 1 И е 2 е 1~ е 2 

следует е 1 = е 2 , т. е. любая правая единица равна любой левой. Этим 
доказаны существование и единственность в множестве О единичного 
элемента, который обозначим, как выше, через 1, 

Далее, 


а 1 = а ~ 1 - 1 = а~ х аа~ 1 . 
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т. е. а~ г = а~ 1 аа~ 1 , где а -1 есть один из правых обратных элемен- 
тов для а. Умножая обе части последнего равенства справа на один 
из правых обратных элементов для а -1 , мы получаем 1 —а~ 1 а, т. е. 
элемент а -1 будет служить и левым обратным элементом для а. 
Если теперь а^ 1 — произвольный правый обратный для а, а^ 1 — про- 
извольный левый обратный, то из равенств 

0-2 (^"2 й| й| - — , 

а^аа^ 1 = а^ 1 (аа^ 1 ) — а^ 1 

следует а^ 1 — а^ 1 , т. е. следуют существование и единственность 
для всякого элемента а из О обратного элемента а -1 . 

Теперь легко показать, что множество О будет группой. Дейст- 
вительно, уравнениям ах — Ь , уа~Ь будут, как легко видеть, удо- 
влетворять элементы 

х — а~ 1 Ь, у = Ьа~ 1 . 

Единственность этих решений следует из того, что если, например, 
ах 1 ~ах 2 , то, умножая обе части этого равенства слева на а~ г , мы 
получаем х 1 = х і . Теорема доказана. 

Мы уже несколько раз встречались с понятием изоморфизма — 
для колец, для линейных пространств, для евклидовых пространств. 
Это понятие может быть определено и для групп и играет в теории 
групп столь же большую роль, как и в теории колец. Группы О 
и О' называются изоморфными, если между ними можно установить 
такое взаимно однозначное соответствие, при котором для любых 
элементов а, Ь из О и соответствующих им элементов а, Ь' из О' 
произведению аЬ соответствует произведение а'Ь'. Как в § 46 (для 
нуля и противоположного элемента в кольце), можно показать, что 
при изоморфном соответствии между группами О и (У единице 
группы О соответствует единица группы О', и если элементу а из О 
соответствует элемент а ' из О', то элементу а~ х соответствует 
элемент а' -1 . 

Переходя к примерам групп, отметим, что если бы опера- 
ция в группе О была названа сложением, то единица группы на- 
зывалась бы нулем и обозначалась символом 0, а вместо обратного 
элемента мы говорили бы о противоположном элементе и обо- 
значали бы его через — а. 

В качестве первого примера групп укажем, что по сложению 
всякое кольцо (и, в частности, поле ) является группой, притом 
абелевой; это — так называемая аддитивная группа кольца. Это 
замечание сразу дает большое количество конкретных примеров 
групп и среди них — аддитивную группу целых чисел, аддитивную 
группу четных чисей, аддитивные группы рациональных чисел, дей- 
ствительных чисел, комплексных чисел и т. д. Заметим, что адди- 
тивные группы целых чисел и четных чисел изоморфны между 
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собой , хотя вторая является лишь частью первой: отображение, ста- 
вящее в соответствие всякому целому числу к четное число 2 к, 
будет взаимно однозначным и, как легко проверить, даже изоморф- 
ным отображением первой из названных групп на вторую. 

По умножению никакое кольцо не является группой, так как 
обратная операция — деление — не всегда выполнима. Положение не 
изменяется и при переходе от произвольного кольца к полю, так 
как в поле остается невыполнимым деление на нуль. Рассмотрим, 
однако, совокупность всех отличных от нуля элементов поля. Так как 
поле не содержит делителей нуля, т. е. произведение двух элемен- 
тов, отличных от нуля, само отлично от нуля, то умножение будет 
для рассматриваемой совокупности алгебраической операцией, притом 
ассоциативной и коммутативной, причем деление уже всегда выпол- 
нимо и не выводит за пределы этой совокупности. Таким образом, 
совокупность отличных от нуля элементов любого поля является 
абелевой группой-, эі в группа называется мультипликативной груп- 
пой поля. Примерами, сюда относящимися, будут мультипликативные 
группы рациональных чисел, действительных чисел, комплексных чисел. 

Группу по умножению составляют, очевидно, все положительные 
действительные числа. Эта группа изоморфна аддитивной группе 
всех действительных чисел : ставя в соответствие всякому положи- 
тельному числу а действительное число Іпл, мы получим взаимно 
однозначное отображение первой группы на вторую, которое будет 
изоморфизмом ввиду равенства 

1п (а&) = 1п а.-\- 1п Ь. 

Возьмем., далее, в поле комплексных чисел совокупность корней 
п- й степени из единицы. В § 19 было доказано, что произведение 
двух корней п- й степени из единицы, а также число, обратное 
к корню я-й степени из единицы, сами принадлежат к рассматриваемой 
совокупности чисел. Так как единица также принадлежит, понятно, 
к этой совокупности и так как умножение любых комплексных чисел 
ассоциативно и коммутативно, то мы получаем, что корни п-й сте- 
пени из единицы составляют по умножению абелеву группу , 
притом конечную порядка п. Таким образом, для любого нату- 
рального числа п существуют конечные группы порядка п. 

Г руппа (по умножению ) корней п-й степени из единицы изо- 
морфна аддитивной группе кольца . 2Г„, построенного в § 45. 
Действительно, если е — первообразный корень л-й степени из еди- 
ницы, то все элементы первой из названных групп имеют вид е к , 
к — 0, 1, ..., л — 1. Если мы поставим в соответствие всякому 
числу е* элемент С ь кольца 2. п , т. е. класс целых чисел, дающих 
при делении на л остаток к , то получим изоморфное соответствие 
между рассматриваемыми группами: если О^/г^л — 1 , О С л — 1 
и если к + / = щ + г-у. где О^г^л — 1, а # равно 0 или 1, то 
е*-е , = е'' и, вместе с тем, С к -{-С 1 —С г . 
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Сейчас уместно указать некоторые примеры числовых множеств, 
не являющихся группами. Так, множество всех целых чисел не будет 
группой по умножению, множество всех положительных действи- 
тельных чисел не будет группой по сложению, множество всех 
нечетных чисел не будет группой по сложению, множество всех 
отрицательных действительных чисел не будет группой по умноже- 
нию. Проверка всех этих утверждений не представляет затруднений. 

Все рассмотренные выше числовые группы являются, конечно, 
абелевыми. Примерами абелевых групп, составленных не из чисел, 
служат линейные пространства: как вытекает из их определения 
(см. §§ 29, 47), всякое линейное пространство над произвольным 
полем Р будет абелевой группой относительно операции сло- 
жения. 

Переходим к примерам некоммутативных групп. 

Множество всех матриц я-го порядка над полем Р не будет 
группой по отношению к операции умножения, так как нарушается 
требование о существовании обратного элемента. Если мы ограни- 
чимся, однако, лишь невырожденными матрицами, то получим уже 
группу. Действительно, произведение двух невырожденных матриц 
будет, как мы знаем, невырожденным-, единичная матрица является 
невырожденной, всякая невырожденная матрица обладает обратной 
матрицей, также невырожденной, и, наконец, закон ассоциативности, 
выполняясь для всех матриц, справедлив, в частности, для матриц 
невырожденных. Можно говорить, следовательно, о группе невыро- 
жденных матриц п-го порядка над полем Р с умножением матриц 
в качестве групповой операции; эта группа некоммутативна при я ^ 2. 

К весьма важным примерам конечных некоммутативных групп 
приводит введенное в § 3 умножение подстановок. Мы знаем, что 
в множестве всех подстановок я-й степени умножение будет алге- 
браической операцией, притом ассоциативной, хотя при я ^ 3 неком- 
мутативной, что тождественная подстановка Услужит единицей этого 
умножения и что для всякой подстановки существует обратная под- 
становка. Таким образом, множество подстановок я-й степени 
составляет по умножению группу, притом конечную порядка п\. 
Эта группа называется симметрической группой п-й степени ; она 
некоммутативна при л ^ 3. 

Рассмотрим теперь вместо совокупности всех подстановок я-й 
степени лишь совокупность четных подстановок, состоящую, как 

мы знаем, из у я! элементов. Используя доказанную в§3 теорему 

о том, что четность подстановки совпадает с четностью числа транс- 
позиций, входящих в какое-либо разложение этой подстановки в про- 
изведение транспозиций, мы получаем, что произведение двух чет- 
ных подстановок само четно-, в самом деле, представление АВ 
в виде произведения транспозиций мы получим, записав соответствую- 
щие разложения для А и В одно за другим. Далее, ассоциативность 
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умножения подстановок нам известна, четность тождественной 
подстановки очевидна. Наконец, четность подстановки Л -1 при 
четной подстановке А следует хотя бы из того, что записи этих 
подстановок можно получить одну из другой переменой мест верхней 
и нижней строк, т. е. они содержат равное число инверсий. Таким 
образом, множество четных подстановок п-й степени будет 

по умножению конечной группой, порядка ~ п\. Эта группа назы- 
вается знакопеременной группой п-й степени ; легко проверить, 
что она некоммутативна при п ^4, хотя будет коммутативной при 
п — 3. 

Симметрические и знакопеременные группы играют очень боль- 
шую роль в теории конечных групп, а также в теории Галуа. Заме- 
тим, что было бы невозможно, по аналогии со знакопеременными 
группами, построить группу по умножению из нечетных подстановок, 
так как произведение двух нечетных подстановок всегда есть четная 
подстановка. 

Большое число разнообразных примеров групп доставляют раз- 
личные ветви геометрии. Укажем один простейший пример такого 
рода: множество всех вращений шара около его центра будет груп- 
пой, притом некоммутативной, если произведением двух вращений 
мы назовем результат их последовательного выполнения. 

§ 64. Подгруппы 

Подмножество А группы О называется подгруппой этой группы, 
если оно само является группой относительно операции, определен- 
ной в группе О. 

При проверке того, является ли подмножество Л группы О под- 
группой этой группы, достаточно проверить: 1) содержится ли в Л 
произведение любых двух элементов из Л; 2) содержит ли Л имеете 
со всяким своим элементом и его обратный элемент. Действительно, 
из справедливости закона ассоциативности в группе О следует его 
справедливость для элементов из Л, а принадлежность к Л единицы 
группы О вытекает из 2) и 1). 

Многие из групп, указанных в предшествующем параграфе, 
являются подгруппами других групп, также там указанных. Так, 
аддитивная группа четных чисел является подгруппой аддитивной 
группы всех целых чисел, а последняя в свою очередь есть под- 
группа аддитивной • группы рациональных чисел. Все эти группы, 
как и вообще аддитивные группы чисел, являются подгруппами адди- 
тивной группы комплексных чисел. Мультипликативная группа поло- 
жительных действительных чисел является подгруппой мультиплика- 
тивной группы всех отличных от нуля действительных чисел. Знако- 
переменная группа я-й степени есть подгруппа симметрической 
группы этой же степени. 
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Подчеркнем, что содержащееся в определении подгруппы требо- 
вание к подмножеству Л группы О быть группой относительно 
групповой операции, определенной в группе О, 
является существенным. Так, мультипликативная группа положитель- 
ных действительных чисел не является подгруппой аддитивной 
группы всех действительных чисел, хотя первое множество содер- 
жится, как подмножество, во втором. 

Если в группе О взяты подгруппы А и В, то их пересечение 
А[\В, т. е. совокупность элементов, лежащих и в А, и в В, 
также будет подгруппой группы О. 

Действительно, если в пересечении А Г) В содержатся элементы 
хну, то они лежат в подгруппе А, а поэтому к А принадлежит 
и цроизведение ху, и обратный элемент х -1 . По тем же соображе- 
ниям элементы ху и х~ 1 принадлежат и к подгруппе В, а поэтому 
они входят и в А Л В. 

Полученный результат справедлив, как легко видеть, не только 
для двух подгрупп, но и для любого числа подгрупп, конечного или 
даже бесконечного. 

Подмножество группы О, состоящее из одного элемента 1, будет, 
очевидно, подгруппой этой группы; эта подгруппа, содержащаяся 
в любой другой подгруппе группы О, называется единичной под- 
группой группы О. С другой стороны, сама группа О является 
одной из своих подгрупп. 

Интересным примером подгрупп служат так называемые цикли- 
ческие подгруппы. Введем сначала понятие степени эле- 
мента а группы О. Если п — любое натуральное число, то произве- 
дение п элементов, равных элементу а, называется л-й степенью 
элемента а и обозначается через а". Отрицательные степени эле- 
мента а можно определить или как элементы группы О, обратные 
положительным степеням этого элемента, или же как произведения 
нескольких множителей, равных элементу а -1 . В действительности 
эти определения совпадают, 


(а") -1 = (а -1 )", л > 0. 


0 ) 


Для доказательства достаточно взять произведение 2л множителей, 
из которых первые л равны а, а остальные равны а -1 , и произвести 
все сокращения. Элемент, равный как левой, так и правой части 
равенства (1), будет обозначаться через а~ п . Условимся, наконец, 
под нулевой степенью а® элемента а понимать элемент 1. 

Заметим, что если операция в группе О называется сложением, 
то вместо степеней элемента а следует говорить о кратных этого 
элемента и записывать их через ка. 

Без труда проверяется, что в любой группе О для степеней 
любого элемента а при любых показателях т и л, положительных, 
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отрицательных или нулевых, имеют место равенства 

а п -а т — а т -а п = а п+т , (2) 

(а п ) т = а пт . (3) 

Обозначим через {а} подмножество группы О, составленное из 
всех степеней элемента а; в него входит и сам элемент а, являю- 
щийся своей первой степенью. Подмножество {а} будет подгруп- 
пой группы О: произведение элементов из {а} лежит в {а} ввиду (2), 
в { а } входит элемент 1, равный а °, и, наконец, {а} вместе со всяким 
своим элементом содержит и его обратный элемент, так как из (3) 
следует равенство 

(а”)' 1 — а~ п . 

Подгруппа {а} называется циклической подгруппой группы О, 
порожденной элементом а. Как показывает равенство (2), она 
всегда коммутативна, даже если сама группа О и некоммутативна. 

Заметим, что нигде выше не утверждалось, что все степени эле- 
мента а являются различными элементами группы. Если это дей- 
ствительно так, то а называется элементом бесконечного порядка. 
Пусть, однако, среди степеней элемента а имеются равные, напри- 
мер, а к = а 1 при кфі, это всегда имеет место в случае конечных 
групп, но может случиться, и в бесконечной группе. Если к>1, то 

а к ~ 1 — 1, 

т. е. существуют положительные степени элемента а, равные 
единице. Пусть л есть наименьшая положительная степень элемента а, 
равная единице, - т~> е. 

1) а" = 1, л > 0, 

2) если а к — 1 , к > 0 , то к^п. 

В этом случае говорят, что а есть элемент конечного порядка , 
а именно порядка л. 

Если элемент а имеет конечный порядок л, то все элементы 

1, а, а г , . . ., а" -1 (4) 

будут, как легко видеть, различными. Всякая другая степень эле- 
мента а, положительная или отрицательная, равна одному из 
элементов (4). Действительно, если к — любое целое число, то, 
деля к на л, получим 

к = гщфг, О^г^л, 
а поэтому, ввиду (2) и (3), 

а к = (ау-а г = а г . 


(5) 
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Отсюда следует, что если элемент а имеет конечный поря- 
док п и а к — 1, то к должно нацело делиться на п. С другой 
стороны, так как 

— 1 =л(— 1) + (л— 1), 
то для элемента а конечного порядка п 


Так как система (4) содержит п элементов, то из полученных 
выше результатов вытекает, что для элемента а, имеющего конеч- 
ный порядок, его порядок п совпадает с порядком (т. е. с чис- 
лом элементов) циклической подгруппы {а}. 

Заметим, наконеи>что всякая группа обладает одним-единств'ен- 
ным элементом первого порядка — это будет элемент 1. Цикличе- 
ская подгруппа {1} совпадает, очевидно, с единичной подгруппой. 

Циклические группы. Группа О называется циклической груп- 
пой, если она состоит из степеней одного из своих элементов а, 
т. е. совпадает с одной из своих циклических подгрупп {а}; эле- 
мент а называется в этом случае образующим элементом группы О. 
Всякая циклическая группа, очевидно, абелева. 

Примером бесконечной циклической группы слу- 
жит аддитивная группа целыхч и сел — всякое целое число 
кратно числу 1, т. е. это число служит образующим элементом рас- 
сматриваемой группы; в качестве образующего элемента можно 
было бы взять также число —1. 

Примером конечной циклической группы по- 
рядка п служит мультипликативная группа корней 
/ 2 -й степени из единицы — в § 19 показано, что все эти корни 
являются степенями одного из них, а именно первообразного корня. 

Следующая теорема показывает, что этими примерами исчерпы- 
ваются по существу все циклические группы: 

Все бесконечные циклические группы изоморфны между собой; 
изоморфны между собой также все конечные циклические группы 
данного порядка п. 

Действительно, бесконечная циклическая группа с образующим 
элементом а отображается взаимно однозначно на аддитивную группу 
целых чисел, если всякому элементу а к этой группы ставится в соот- 
ветствие число к ; это отображение будет изоморфным, так как, 
по (2), при перемножении степеней элемента а показатели склады- 
ваются. Если же дана конечная циклическая группа О порядка п 
с образующим элементом а, то обозначим через е первообразный 
корень / 2 -й степени из единицы и сопоставим всякому элементу а к 
группы О, 0 ^ к /г, число е*. Это будет взаимно однозначное 
отображение группы О на мультипликативную группу корней л-й 
степени из 1, изоморфность которого следует из (2) и (5). 



402 группы [гл. 14 

Эта теорема позволяет говорить просто о бесконечной цикличес- 
кой группе или о циклической группе порядка п. 

Докажем, далее, следующую теорему: 

Всякая подгруппа циклической группы сама циклическая. 

В самом деле, пусть 0={п} есть циклическая группа с обра- 
зующим элементом а, бесконечная или конечная, и пусть А будет 
подгруппа группы О. Можно считать, что А отлична от единичной 
подгруппы, так как иначе доказывать было бы нечего. Предположим, 
что а к есть наименьшая положительная степень элемента а, содер- 
жащаяся в А; такая степень существует, так как если в А содер- 
жится отличный от 1 элемент а~ $ , 8 > 0, то содержится и обратный 
ему элемент а*. Допустим, что в А содержится также элемент а 1 , I ф0, 
причем / не делится на к. Тогда, если й, й > 0, есть наиболь- 
ший общий делитель чисел к и /, то существуют такие целые числа и 
и ѵ, что 

ки + іѵ — й , 

а поэтому в подгруппе А должен содержаться элемент 

(а*) и -(а 1 )* = а?, 

но так как при наших предположениях <1 < к, то мы приходим в 
противоречие с выбором элемента а к . Этим доказано, что А — {а к }. 

Разложения группы по подгруппе. Если в группе О взяты 
подмножества М и Ы, то под произведением МЫ этих подмножеств 
понимается совокупность элементов группы О, которые хотя бы 
одним способом представимы в виде произведения некоторого эле- 
мента из М на некоторый элемент из N. Из ассоциативности груп- 
повой операции следует ассоциативность умножения подмножеств 
группы, 

ЩЫ)Р=М{ЫР). 

Одно из множеств М , N может состоять, понятно, лишь из 
одного элемента а. В этом случае мы получаем произведение аЫ 
элемента на множество или произведение Ма множества на элемент. 

Пусть в группе О дана произвольная подгруппа А. Если х — 
любой элемент из О, то произведение хА называется левым смежным 
классом группы О по подгруппе А, порождаемым элементом х. 
Понятно, что элемент х содержится в смежном классе хА, так как 
подгруппа А содержит единицу, но Х'1=х. 

Всякий левый смежный класс порождается любым из своих эле- 
ментов, т. е. если элемент у содержится в смежном классе х А, то 

уА = хА. (6) 

Действительно, у можно представить в виде 
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где а — элемент подгруппы Л. Поэтому для любых элементов а! 
и а" из А будет 

уа =х{аа’), 
ха * =у (а~Ѵ'), 

чем и доказывается равенство (6). 

Отсюда следует, что два любых левых смежных класса группы О 
по подгруппе А или совпадают, или же не имеют ни одного 
общего элемента. Действительно, если смежные классы хА и уА 
содержат общий элемент г, то 

хА~гА —у А. 

Таким образом, вся группа О распадается на непересекающиеся 
левые смежные классы по подгруппе А. Это разложение называется 
левосторонним разложением группы О по подгруппе А. 

Заметим, что одним из левых смежных классов этого разложения 
будет сама подгруппа А; этот смежный класс порождается элемен- 
том 1 или, вообще, любым элементом а из А, так как 

аА = А. 

Понятно, что, называя правым смежным классом группы О 
по подгруппе А, порождаемым элементом х, произведение Ах, 
мы аналогичным путем получили бы правостороннее разложение 
группы О по подгруппе А. Для абелевой группы оба ее разложения 
по любой подгруппе, левостороннее и правостороннее, будут, понятно, 
совпадать, т. е. можно говорить просто о разложении группы 
по подгруппе. 

Так, разложение аддитивной группы целых чисел по подгруппе 
чисел, кратных числу к, состоит из к различных смежных классов, 
порождаемых соответственно числами 0, 1, 2, ...,к — 1. При этом 
в классе, порождаемом числом I, 0^1^ к — 1, собраны все те 
числа, которые при делении на к дают остаток I. 

В некоммутативном случае разложения группы по некоторой под- 
группе могут оказаться различными. 

Рассмотрим, например, симметрическую группу 3-й степени ^ 3 , 
причем, в соответствии с § 3, будем записывать ее элементы через 
циклы. В качестве подгруппы А возьмем циклическую подгруппу 
элемента (12); она состоит из тождественной подстановки и самой 
подстановки (12). Другими левыми смежными классами будут: 
класс (ІЗ)-Л,' состоящий из подстановок (13) и (132), и класс (23)-Л, 
состоящий из подстановок (23) и (123). С другой стороны, правыми 
смежными классами группы 5 3 по подгруппе А будут: сама под- 
группа А, класс Л-(13), состоящий пз подстановок (13) и (123), 
и класс Л-(23), состоящий из подстановок (23) и (132). Мы видим, 
что правостороннее разложение отличается в рассматриваемом случае 
от левостороннего. 
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Для случая конечных групп существование разложений группы 
по подгруппе приводит к следующей важной теореме: 

Теорема Лагранжа. Во всякой, конечной группе порядок 
любой подгруппы является делителем порядка самой группы. 

В самом деле, пусть в конечной группе О порядка п дана под- 
группа А порядка к. Рассмотрим левостороннее разложение группы О 
по подгруппе А. Пусть оно состоит из у. классов; число у назы- 
вается индексом подгруппы А в группе О. Каждый левый класс хА 
состоит ровно из к элементов, так как если 

ха± — ха 2 , 

где а г и а г — элементы из А, то а 1 = а 2 . Таким образом, 

л = Ау, (7) 

что и требовалось доказать. 

Так как порядок элемента совпадает с порядком его циклической 
подгруппы, то из теоремы Лагранжа следует, что порядок всякого 
элемента конечной группы является делителем порядка группы. 

Из теоремы Лагранжа следует также, что всякая конечная 
группа, порядок которой есть простое число, будет -цикли- 
ческой. Действительно, эта группа должна совпадать с циклической 
подгруппой, порожденной любым ее элементом, отличным от единицы. 
Отсюда вытекает, вйиду полученного выше описания циклических 
групп, что для всякого простого числа р существует единствен- 
ная, с точностью до изоморфизма, конечная группа порядка р,- 

§ 65. Нормальные делители, фактор-группы, гомоморфизмы 

Подгруппа А группы О называется нормальным делителем этой 
группы (или инвариантной подгруппой ), если левостороннее раз- 
ложение группы О по подгруппе А совпадает с правосторонним. 

Таким образом, все подгруппы абелевой группы являются в ней 
нормальными делителями. С другой стороны, во всякой группе О 
и единичная подгруппа, и сама эта группа будут нормальными дели- 
телями: оба разложения группы О по единичной подгруппе совпадают, 
с разложением группы на отдельные элементы, оба разложения 
группы О по самой этой группе состоят из одного класса О. 

Укажем более интересные примеры нормальных делителей в не- 
коммутативных группах. В симметрической группе 3-й степени 
циклическая подгруппа элемента (123), состоящая из тождественной 
подстановки и подстановок (123) и (132), будет нормальным дели- 
телем: в обоих разложениях группы $ 3 по этой подгруппе второй 
смежный класс состоит из подстановок (12), (13). и (23). 

Вообще в симметричной группе л-й степени 5 п знакопеременная 
группа л-й степени А п будет нормальным делителем. Действительно, 

группа А п имеет порядок -^-л!, поэтому всякий смежный класс 
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группы $ п по подгруппе А п должен состоять из стольких же эле- 
ментов и, следовательно, такой класс имеется еще только один, 
а именно совокупность нечетных подстановок. 

В мультипликативной группе невырожденных квадратных матриц 
порядка п с элементами из поля Р те матрицы, определитель кото- 
рых равен 1, составляют,' очевидно, подгруппу. Это будет даже 
нормальный делитель, так как смежным классом по этой подгруппе, 
одновременно левым и правым, порождаемым матрицей М, является 
класс всех матриц, определитель которых равен определителю 
матрицы М — достаточно вспомнить, что при умножении матриц их 
определители перемножаются. 

Определению нормального делителя, приведенному выше, можно 
придать такую форму: 

Подгруппа А группы О называется, нормальным делителем этой 
группы, если для всякого элемента х из О 

хА~Ах, (1) 

т. е. для всякого элемента х из О и элемента а из Л можно подо- 
брать в А такие элементы а' и а", что 

ха—а'х, ах=ха". (2) 

Можно указать и другие определения нормального делителя, 
равносильные исходному. Так, назовем элементы а и Ь группы О 
сопряженными , если в О существует хотя бы один такой элемент х, 
что 

Ь = х~ 1 ах, (3) 

т. е., как говорят, элемент Ь получается из элемента а трансфор- 
мированием элементом х. Из (3) следует, очевидно, равенство 

а = х Ь х ~ 1 = ( д: “ 1 ) - 1 Ьх ~ 1 . 

Подгруппа А группы О тогда и только тогда будет нор- 
мальным делителем в О, если вместе со -всяким своим элемен- 
том а она содержит и все элементы, сопряженные с ним в О. 

Действительно, если А — нормальный делитель в О, то, по (2), 
для выбранного нами элемента а из Л и любого элемента х из О 
можно подобрать в А такой элемент а",“ что 

ах = ха". 

Отсюда 

х~ х ах — а”, 

т. е. всякий элемент, сопряженный с а , содержится в А. Обратно, 
если подгруппа А содержит вместе со всяким своим элементом а 
и все элементы, ему сопряженные, то в Л содержится, в частности, 
элемент 

х~ 1 ах = а", 
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откуда следует второе из равенств (2). По той же причине в А 
содержится и элемент 

(х~ 1 )~ 1 ах~ 1 = хах~ х =а', 

откуда следует и первое из равенств (2). 

Пользуясь этим результатом, легко доказать, что пересечение 
любых нормальных делителей группы О само будет нормальным 
делителем этой группы. В самом деле, если А и В — нормальные 
делители группы О, то, как показано в предыдущем параграфе, 
пересечение А П В будет подгруппой группы О. Пусть с — любой 
элемент из А П В, х — любой элемент группы О. Тогда элемент х _1 сх 
должен содержаться и в А, и в В, так как оба этих нормальных 
делителя содержат элемент с. Отсюда следует, что элемент х~ х сх 
входит в пересечение Ар\В. 

Фактор-группа. Значение понятия нормального делителя основано 
на том, что из смежных классов по нормальному делителю — ввиду (1) 
левые и правые смежные классы можно в этом, случае не раз- 
личать — некоторым весьма естественным способом может быть по- 
строена новая группа. 

Заметим сначала, что если А — произвольная подгруппа группы 
О, то 

АА^А, (4) 

так как произведение любых двух элементов из подгруппы А при- 
надлежит к А и, вместе с тем, умножая все элементы из А на еди- 
ницу, мы уже получим всю подгруппу А. 

Пусть А будет теперь нормальным делителем группы О. В этом 
случае произведение любых двух смежных классов О по А 
(в смысле умножения подмножеств группы С?) само будет смеж- 
ным классом по А. Действительно, используя ассоциативность 
умножения подмножеств группы, равенство (4) и равенство 

уА — Ау 

(ср. (1)), мы для любых элементов х и у группы О получим: 

х А -у А = хуАА = хуА. (5) 

Равенство (5) показывает, что для того, чтобы найти произведе- 
ние двух данных смежных классов группы О по нормальному дели- 
телю А, следует произвольным образом выбрать в этих смежных 
классах по одному представите л ю — напомним, что всякий смеж- 
ный класс порождается любым из своих элементов — и взять тот 
смежный класс, в котором лежит произведение этих представителей. 

Таким образом, в множестве всех смежных классов группы В 
по нормальному делителю А определена операция умножения. 
Покажем, что при этом выполняются все требования, входящие 
в определение группы. В самом деле, ассоциативность умножения 
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смежных классов следует из ассоциативности умножения подмно- 
жеств группы. Роль единицы играет сам нормальный делитель А, 
являющийся одним из смежных классов разложения О по А: именно, 
ввиду (4) и (1) для любого х из О будет 

хА-А=хА, А -хА =хАА — хА. 

Наконец, для смежного класса хА обратным будет смежный класс 
х~ 1 А, так как 

хА •х~ 1 А — 1 - А — А. 

Построенная нами группа называется фактор-группой группы О 
по нормальному делителю А и обозначается через О/А. 

Мы видим, что со всякой группой связывается целый набор 
новых групп — ее фактор-групп по различным нормальным дели- 
телям. При этом фактор-группа группы О по единичной подгруппе 
будет, понятно, изоморфной с самой группой О. 

Всякая фактор-группа О/А абелевой группы О сама является 
абелевой, так как из ху —ух следует 

хА -у А — хуА -ухА—уА-хА. 

Всякая фактор-группа О/А циклической группы О сама 
циклическая, так как если О порождается элементом 0={^}, 
и если дан произвольный смежный класс хА, то существует такое 
целое число к, что 

х = § к 

и поэтому 

хА = ($А) к . 

Порядок любой фактор-группы С/А конечной группы О 
является делителем порядка самой этой группы. Действительно, 
порядок фактор-группы С/А равен индексу нормального делителя А 
в группе О, а поэтому можно воспользоваться равенством (7) из 
предшествующего параграфа. 

Приведем некоторые примеры фактор-групп. Так как в адди- 
тивной группе целых чисел подгруппа чисел, кратных натуральному 
числу к, имеет, как показано в предшествующем параграфе, индекс к, 
то фактор-группа нашей группы по этой подгруппе будет конечной 
группой порядка к , притом циклической, так как сама рассматри- 
ваемая группа циклическая. 

Фактор-группа симметричной группы п - й степени 8 п по знако- 
переменной группе л-й степени А п будет группой 2-го порядка, 
причем, ввиду простоты числа 2, циклической группой (см. конец 
предшествующего параграфа). 

Выше приведено описание смежных классов мультипликативной 
группы невырожденных матриц порядка п с элементами из поля Р 
по нормальному делителю, составленному из матриц, определитель 
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которых равен 1. Из этого описания следует, что соответствующая 
фактор-группа изоморфна мультипликативной группе отличных от 
нуля чисел поля Р. 

Гомоморфизмы, Понятия нормального делителя и фактор-группы 
тесно связаны со следующим обобщением понятия изоморфизма. 

Отображение <р группы Она группу О', ставящее в соответствие 
всякому элементу а из О однозначно определенный элемент а' = ац> 
из О', называется гомоморфным отображением О на О' (или 
просто гомоморфизмом), если всякий элемент а' из О' служит при 
этом отображении образом некоторого элемента а из О, а' = аф, 
и если для любых элементов а, Ь группы О 

(ай)ф = дф-6ф. 

Очевидно, что, потребовав дополнительно взаимную однознач- 
ность отображения ф, мы получили бы уже известное нам опреде- 
ление изоморфизма. 

Если ф — гомоморфизм группы О на группу О' и 1 и а — со- 
ответственно единица и произвольный элемент группы О, 1' — 
единица группы О', то 

1ф= Г, 

(а -1 ) ф — (аф) -1 . 

Действительно, если 1ф = г' и х’ — произвольный элемент 
группы О', то в О существует такой элемент х, что лдр = л;'. 
Отсюда 

х’ — лхр — (х- \) ф = лир - 1ф = х -е' . 

Аналогично 

х' — е'х' 

и, следовательно, е' = 1'. 

С другой стороны, если (а -1 ) ф = й', то 

Г = 1ф = (аа -1 ) ф = аф - (а -1 ) ф = аср-Ь' 

и, аналогично, 

Г=6'-аф, 

откуда 6' = (аф) _1 . 

Назовем ядром гомоморфизма ф группы О на группу (У сово- 
купность тех элементов группы О, которые отображаются при ф 
в единицу 1' группы О'. 

Ядро всякого гомоморфизма ф группы О является нормаль- 
ным делителем группы О. 

Действительно, если элементы а, Ь группы О входят в ядро 
гомоморфизма ф, т. е. 

аф = 6ф = 1 ', 

то 

(аЬ) ф = аф • 6ф = 1 ' • 1 ' = 1 
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т. е. и произведение аЬ содержится в ядре гомоморфизма ф. С дру- 
гой стороны, если аф = 1', то 

(а -1 ) ф = (йф) -1 = Г -1 = 1', 

т. е. и а -1 входит в ядро гомоморфизма ф. Наконец, если аф= Г, 
а х — произвольный элемент группы О, то 


(х І ах)ір = (х х ) ф- аф-д:ф = (д:ф) 1 -Г-л:ф=Г. 


Ядро рассматриваемого гомоморфизма оказалось подгруппой груп- 
пы О, содержащей вместе со всяким своим элементом и все эле- 
менты, с ним сопряженные; оно будет, следовательно, нормальным 
делителем. 

Пусть теперь А — произвольный нормальный делитель группы О. 
Ставя в соответствие всякому элементу х группы О тот смежный 
класс хА по нормальному делителю А, в котором этот элемент 
лежит, мы получим отображение группы О на всю фактор-группу О/А. 
Из определения умножения в группе О/А (см. (5)) следует, что это 
отображение будет гомоморфным. 

Полученный гомоморфизм называется естественным гомомор- 
физмом группы О на фактор-группу О/А. Ядром этого гомомор- 
физма служит, очевидно, сам нормальный делитель А. 

Отсюда следует, что нормальные делители группы О и только 
они служат ядрами гомоморфизмов этой группы. Этот результат 
можно рассматривать как еще одно определение нормального 
делителя. 

Оказывается, что все группы, на которые группа О может гомо- 
морфно отображаться, по существу исчерпываются фактор-группами 
этой группы, а все гомоморфизмы группы О — ее естественными 
гомоморфизмами на свои фактор-группы. Точнее, справедлива 
следующая 

Теорема о гомоморфизмах. Пусть дан гомоморфизм ф 
группы О на группу О' и пусть А — ядро этого гомоморфизма. 
Тогда группа О' изоморфна фактор-группе О/А, причем суще- 
ствует такое изоморфное отображение о первой из этих групп 
на вторую, что результат последовательного выполнения ото- 
бражений ф и о совпадает с естественным гомоморфизмом 
группы О на фактор-группу О/ А. 

В самом деле, пусть х' будет произвольный элемент группы О', 
а х — такой элемент группы О, что хц> = х'. Так как для любого 
элемента а из ядра А гомоморфизма ф имеет место равенство 
аф = 1 ', то 

(ха) ф = хср- аср — х' • 1 ' —х', 

т. е. все элементы смежного класса хА отображаются при ф 
в элемент х' . 
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С другой стороны, если г — любой такой элемент группы О, 
ЧТО 2Ц) — х', то 

{Х~ х 2) ф = Х~ 1 (Р'2<Р = (ЛГф) -1 -2ф = х'~ 1 ‘Х' = 1 


т. е. х~ х г содержится в ядре А гомоморфизма ф. Если мы положим 
х~ х г = а, то г = ха, т. е. элемент г содержится в смежном классе хА. 
Таким образом, собирая все те элементы группы О, которые при 
гомоморфизме ф отображаются в фиксированный элемент х' группы 
О', мы получаем точно смежный класс хА. 

Соответствие о, относящее каждому элементу х' из О' тот 
смежный класс группы О по нормальному делителю А, который 
состоит из всех элементов группы О, имеющих х' своим образом 
при ф, будет взаимно однозначным отображением группы О' на 
группу О/А. Это отображение о будет изоморфизмом, так как если 


т. е. 


то 

а поэтому 


х'о — хА , у'а=уА, 

Х (р —х', уср =у\ 

(ху) ф — Хф -УФ = х'у', 

(х'у') а—хуА = хА‘уА = х'а-у'а. 


Наконец, если х — произвольный элемент из О и х(р~х', то 
(дгф) а — х'о — хА, 


т. е. последовательное выполнение гомоморфизма ф и изоморфизма а 
на самом деле отображает элемент х в порождаемый им смежный 
класс хА. Теорема доказана. 


§ 66. Прямые суммы абелевых групп 

Мы хотим закончить главу одной теоретико-групповой теоремой, 
более глубокой, чем те элементарные свойства групп, которые 
излагались выше. Именно, опираясь на уже известное нам из § 64 
описание циклических групп, мы получим в следующем параграфе 
полное описание конечных абелевых групп. 

Как принято в теории абелевых групп, для групповой операции 
будет использоваться аддитивная запись: мы будем говорить 
о сумме а-\-Ь элементов а и Ь группы, о нулевой под- 
группе 0, о кратных ка некоторого элемента а и т. д. 

В этом параграфе мы изучим одну конструкцию, которую будем 
излагать применительно к абелевым группам, хотя ее можно было 
бы вводить сразу для любых [т. е. не обязательно коммутативных) 
групп. Эта конструкция подсказывается следующими примерами. 
Плоскость, рассматриваемая как двумерное действительное, линейное 
пространство, является абелевой группой относительно сложения 
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векторов. Любая прямая в этой плоскости, проходящая через начало 
координат, будет подгруппой указанной группы. Если А х и А 2 — 
две различные такие прямые, то, как известно, всякий вектор на 
плоскости, выходящий из начала координат, однозначно предста- 
вляется в виде суммы своих проекций на прямые А 2 и А 2 . Ана- 
логично, всякий вектор трехмерного линейного пространства одно- 
значно записывается в виде суммы трех векторов, принадлежащих 
к трем заданным прямым А х , А 2 и А 3 , если только эти прямые не 
лежат в одной плоскости. 

Абелева группа О называется прямой суммой своих подгрупп 
А х , Л 2 , . . . , А к , 

0 = А 1 + /4 2 + . . . + А к , (1) 

если всякий элемент х группы О записывается, притом един- 
ственным способом, в виде суммы элементов а ѵ а 2 , 
взятых соответственно в подгруппах А ѵ А 2 , . А к , 

х = % + а 2 + . . . + а к . (2) 

Запись (1) называется прямым разложением группы О, под- 
группы А(, і — 2, к , — прямыми слагаемыми этого раз- 

ложения, а элемент а і из (2) — компонентой элемента х в прямом 
слагаемом А ( разложения (1), г — 1, 2, к. 

Если дано прямое разложение (1) группы О и если прямые 
слагаемые А { этого разложения, все или некоторые, сами раз- 
ложены в прямую сумму , 

А і ~ Ац + А[2 + . . . + Ацг ( , к і '^\, (3) 

то группа О будет прямой суммой всех своих подгрупп 
А іР 2, к { , і — 1 , 2, к. 

Действительно, для произвольного элемента х группы О суще- 
ствует запись (2) относительно прямого разложения (1), а для 
каждой компоненты а-, /= 1, 2, к, — запись 

а ( = а п + а і 2 + • • • + а 11 ц (4) 

относительно прямого разложения (3) группы А ; . Ясно, что х будет 
суммой всех элементов а 1р /=1, 2, ..., к ь і— 1 , 2, ..., к. 
Единственность этой записи вытекает из того, что, беря любую 
запись элемента х в виде суммы элементов, взятых по одному 
в подгруппах А ( р и складывая слагаемые, принадлежащие к одной 
и той же подгруппе А { , / == 1 , 2, к , мы должны получить как 

раз равенство (2); с другой стороны, каждый элемент а і обладает 
лишь одной записью вида (4). 

Определению прямой суммы можно придать иную форму. Вве- 
дем сначала еще одно понятие. Если в абелевой группе О даны 
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некоторые подгруппы В х , В 2 , . .., В ь то обозначим через {Б^ 
В 2 , . .., В г ) совокупность элементов у группы О, которые хотя бы 
одним способом могут быть записаны в виде суммы эле- 
ментов Ь х , Ь 2 , Ь ІУ взятых соответственно в подгруппах 

> & 2 ’ • • ч 

У = Ь Х + Ь 2 +... (5) 

Множество {В х , В 2 , . .., В будет подгруппой группы О. 

Говорят, что эта подгруппа порождена подгруппами В х , Б 2 , . . ., В х . 

Для доказательства возьмем в {Б!, Б 2 , . .., Б,} элементу 
с записью (о), а также элемент у', обладающий аналогичной записью 

У' ~ Ь 1 ~Ь Ь 2 + • • • 4~ Ь х , 

где Ьі — элемент из Б ( ., і — 1, 2, /. Тогда 

У Л~У — (&і + Ь х ) + (Ь 2 4- М + • • • + [Ь х + Ь{), 

т. е. элементы у +у' и — у также обладают хотя бы одной записью 
вида (5) и, следовательно, принадлежат к множеству {Б х , Б 2 , . . . , Б,}, 
что и требовалось доказать. 

Подгруппа {В х , Б 2 , ..., Б,} содержит каждую из подгрупп В ,, 
/ = 1 , 2, ...,/. Действительно, всякая подгруппа группы О со- 
держит нуль этой группы, а поэтому, беря, например, в подгруппе В х 
любой элемент Ь х , а в подгруппах Б 2 , ..., В х — элемент 0, мы 
получим для элемента Ь х следующую запись вида (5): 

*і=*і + 0+...+0. 

Абелева группа О тогда и только тогда будет прямой сум- 
мой своих подгрупп А х , А 2 , . . А к , если она порождается этими 
подгруппами, 

0={А Х , А 2 , .... А к ), (6) 

и если пересечение каждой подгруппы А-, і = 2, . . . , к, с под- 
группой, порожденной всеми предшествующими подгруппами 
А х , А 2 , .... А і _ 1 , содержит только нуль, 

{А х , А 2 , .... А^ПА^О, і = 2 к. (7) 

Действительно, если группа О обладает прямым разложением (1), 
то для всякого элемента х из О существует запись (2), а поэтому 
имеет место равенство (6). Справедливость равенств (7) вытекает 
из единственности записи (2) для любого элемента х\ если 
бы для некоторого і пересечение {Л 1 , А 2 , А (-1 } П А ( . содержало 

ненулевой элемент х, то, с одной стороны, х можно записать как 
элемент а і из А і: т. е. х—а ІУ и поэтому 

*=0+...+0-М,.+ 0+...+0і 


( 8 ) 
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с другой стороны, х, как элемент из подгруппы {Л^ Л 2 , і} 

обладает записью вида 

Х — а 1 + а 2 "Ь • • • + а і- 1>. 

т. е. 

х — а 1 + о- 2 + • • • + а і-і + 6 + • • • + 0- (9) 

(8) и (9) будут, очевидно, двумя разными записями вида (2) для 
элемента х. 

Обратно, пусть выполняются равенства (6) и (7). Из (6) следует, 
что любой элемент х группы О обладает хотя бы одной записью 
вида (2). Пусть, однако, для некоторого элемента х существуют 
две различные записи вида (2), 

х = а 1 ~Ь а 2 "4" • • • + а к — а і + а г + • • • + а к • (Ю) 

Тогда можно найти такое і, і^к, что 

а к, а к-і ==а Іі-іг •••> а і + і =а і + і, . (11) 

но 

а і ®/і 

т. е. 

а : — а'іФд. (12) 

Из (10) и (11) следует, однако, равенство 

а і — °і — ( а і — а і) + ( а 2 — а г) + • • • 4* ( а і- 1 ~ а і-і)і 

противоречащее, ввиду (12), равенству (7). Теорема доказана. 

На понятие прямой суммы можно посмотреть с совсем иной 
стороны. Пусть дано к произвольных абелевых групп Л г , А 2 , . . ., А к , 
среди которых могут быть и изоморфные. Обозначим через О сово- 
купность всевозможных систем вида 

( а іі • і °ь)> (1 6) 

составленных из элементов, взятых по одному в каждой из групп 
Л х , Л 2 , ..., А к . Множество О станет абелевой группой, если сло- 
жение систем вида (13) будет определено правилом: 

К, а%, а к) + ( а і. «г, а'к) = 

= («!+• «і, <* 2 + а 2 , а к + а к ), (14) 

т. е. складываются элементы в каждой из заданных групп Л х , 
Л 2 , ..., А к отдельно. Действительно, ассоциативность и коммута- 
тивность этого сложения вытекают из справедливости этих свойств 
в каждой из заданных групп; роль нуля играет система 

(9і> 0г> • • • > 9^), 
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где через 0^ обозначен нулевой элемент группы А { , і — 1, 2, . к; 
противоположной для системы (13) будет система 

( а х , а 2 , а к ). 

Построенная абелева группа О называется прямой суммой групп 
А х , Л 2 , А к и записывается, как и выше, через 

0=А 1 -\-А 2 + . . . + Л А . 


Оправданием для этого названия служит то, что группа О, являю- 
щаяся прямой суммой групп Л 1; Л 2 , . . . , А к в только что опре- 
деленном смысле, может быть разложена в прямую сумму своих 
подгрупп Л х , Л г , А к , соответственно изоморфных группам 

А]_, Л 2 , • . . , А к . ' 

Именно, обозначим через Л*, і=1, 2, к, совокупность тех 
элементов группы О, т. е. систем вида (13), у которых на і-м 
месте стоит произвольный элемент а і из группы ч Л,, а все осталь- 
ные места заняты нулями соответствующих групп; это будут, 
следовательно, системы вида 


(°і, 


0,-і, 


0 , 


+ 1 > 


0 *). 


(15 


Определение сложения (14) показывает, что множество Л, будет 
подгруппой группы О; изоморфизм этой подгруппы с группой Л,- 
мы получим, сопоставляя каждой системе (15) элемент о,- группы Л,-. 

Остается доказать, что группа О является прямой суммой под- 
групп Лі, Л 2 , . . ., А к . Действительно, любой элемент (13) группй О 
можно представить в виде суммы элементов из указанных подгрупп: 


і а ѵ а 2> •••> а н) = ( а і. °2, •••. 0 *) + 

(0ц о 2 , Оз, 0 А ) -|- • • • (0)> 0г, •••> 0*-і> а *)- 

Единственность этого представления вытекает из того, что различ- 
ные системы вида (13) являются различными элементами 
группы О. 

Если даны две системы абелевых групп, А х , Л 2 , ..., А к и 
В х , В 2 , ..., В к , причем группы Л,- и В і изоморфны , г = 1 , 2, ... 
. . . , к, то группы 

о=л 1 +л а + ...+л А 


и 

Н— В х 4- В 2 + . . . + В к 
также будут изоморфными. 

Действительно, если для 1 = 1, 2, . .., к между группами А і 
и В[ установлен изоморфизм ф,-, сопоставляющий каждому эле- 
менту а і из Аі элемент из В х , то отображение ф, относящее 
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всякому элементу (а 1 , а 2 , а к ) группы О элемент группы Н, 

определяемый равенством 

К. а 2 , ..., а й )ф = (а 1 ф 1> . а 2 ф 2 , а к ф й ), 

будет, очевидно, изоморфным отображением группы О на группу Н. 

Если даны конечные абелевы группы А х , А 2 А к , имею- 
щие соответственно порядки п г , п 2 , п ь , то прямая сумма О 

этих групп также будет конечной группой и ее порядок п 
равен произведению порядков прямых слагаемых, 

п=п 1 п 2 ... п к . (16) 

Действительно, число различных систем вида (13), у которых 
элемент а х может принимать п х различных значений, элемент а 2 
принимает п 2 различных значений и т. доопределяется равенством (16). 
Рассмотрим некоторые примеры. 

Если порядок п конечной циклической группы {а} разлагается 
в произведение двух взаимно простых натуральных чисел, 

п — зі, {в, <) = 1, 

то группа {а} разлагается в прямую сумму двух циклических 
групп, имеющих соответственно порядки з и і. 

Будем употреблять для группы {<?} аддитивную запись. Если 
положим Ь — іа, то 

зЬ—(зі) а=па — О, 

но для 0 < к < 5 

кЬ=(кі) аф О, 

т. е. циклическая подгруппа м имеет порядок у. Аналогично 
циклическая подгруппа {с} элемента с— за имеет порядок і. Пере- 
сечение {^} П {с} содержит только нуль, так как если кЬ — Іс при 
О О то 

(кі) а~(1з) а, 

откуда, так как числа кі и Із меньше п, 

кі — із, 

что невозможно ввиду взаимной простоты чисел 5 и і. Наконец, 
существуют такие числа и и ѵ, что 

зифіѵ=1, 

а поэтому 

а=ѵ (іа) + и (за)~ѵЬ -\-ис, 

и, следовательно, любой элемент группы {а} можно представить 
как сумму элементов из подгрупп {^} и {с}. 

Назовем абелеву группу О неразложимой , если ее нельзя раз- 
ложить в прямую сумму двух или нескольких ее подгрупп, отличных 
от нулевой подгруппы. Конечная циклическая группа, порядок 
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которой является некоторой степенью простого числа р, называется 
примаркой циклической группой, относящейся к простому числу р. 
Применяя несколько раз доказанное выше утверждение, мы получим, 
что всякая конечная циклическая группа разлагается в прямую 
сумму примарных циклических групп, относящихся к различным 
простым числам. Точнее, циклическая группа порядка 

п=р к рр^ ... Р к \ 

где р ѵ р 2 , .... р $ — различные простые числа, разлагается 
в прямую сумму з циклических групп, имеющих соответственно 
порядки р к \ р\і, . . . , р\>. 

Всякая примарная циклическая группа неразложима. 

В самом деле, пусть дана конечная циклическая группа {а} 
порядка р к , где р — простое число. Если бы эта группа была раз- 
ложимой, то, по (7), она обладала бы ненулевыми подгруппами, 
пересечение которых равно нулю. В действительности, однако, 
всякая ненулевая подгруппа нашей группы со- 
держит отличный от нуля' элемент 

Ь — а. 

Для доказательства возьмем произвольный ненулевой элемент х 
нашей группы, 

х — 8 а, 0<у</Л 
Число а можно записать в вйде 

8—р‘з', 0 < / < /г, 

где число у' уже не делится на р и, следовательно, взаимно просто 
с ним, а поэтому существуют такие числа и и ѵ, что 

з’и +рѵ = 1. 

Тогда 

(р к ~ 1 ~ 1 и)х = (р к ~‘~ 1 из) а = (р к ~ 1 из') а — 

= р к ~ 1 (1 — рѵ) а == (р к ~ х — р к ѵ) а=р к ~ 1 а — ѵ(р к а) = р к ~ 1 а = Ь, 

т. е. элемент Ь входит в циклическую подгруппу {х}. 

Аддитивная группа целых чисел (т. е. бесконечная цикли- 
ческая группа), а также аддитивная группа всех рациональных 
чисел являются неразложимыми группами. 

Неразложимость обеих указанных групп вытекает из того, что 
в каждой из этих групп для любых двух ненулевых элементов 
существует ненулевое общее кратное, т. е. любые две ненулевые 
циклические подгруппы обладают ненулевым пересечением. 

Заметим, что если операция в абелевой группе О называется 
умножением, то следует говорить не о прямой сумме, а о прямом 
произведении. 
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Мультипликативная группа отличных от нуля действи- 
тельных чисел разлагается в прямое произведение мультиплика- 
тивной группы положительных действительных чисел и группы 
по умножению, составленной из чисел 1 'и — 1. 

Действительно, в пересечении указанных двух подгрупп нашей 
группы содержится лишь число 1 — единичный элемент этой группы. 
С другой стороны, всякое положительное число является произведе- 
нием самого себя на число 1 , всякое отрицательное число — произ- 
ведением своей абсолютной величины на число — 1. 

§ 67. Конечные абелевы группы 

Если мы возьмем любой конечный набор примарных циклических 
групп, некоторые из которых могут относиться к одному и тому же 
простому числу или даже иметь один и тот же порядок, т. е. быть 
изоморфными, то прямая сумма этих групп будет конечной абелевой 
группой. Оказывается, что этим исчерпываются все конечные абе- 
левы группы: 

Основная теорема о конечных абелевых группах. 
Всякая конечная абелева группа О, не являющаяся нулевой 
группой, разлагается в прямую сумму примарных циклических 
подгрупп. 

Доказательство этой теоремы начнем с замечания, что в группе О 
непременно найдутся ненулевые элементы,, порядки которых 
являются степенями простых чисел. Действительно, если неко- 
торый ненулевой элемент х группы О имеет порядок I, Іх = 0, и 
если р к , ку> 0, есть такая степень простого числа р, на которую 
число I делится, 

1 = р к т, 

то элемент тх отличен от нуля и имеет порядок р к . 

Пусть 

Рѵ Р 2 , ■ ■ Р, (1) 

будут все различные простые числа, некоторые степени которых 
служат порядками некоторых элементов группы О. Обозначим 
через р любое из этих чисел, а через Р совокупность элементов 
группы О, имеющих своими порядками степени числа р. 

Множество Р является подгруппой группы О. Действительно, 
в Р входит элемент 0, так как его порядок есть 1 =р°. Далее, 
если р к х = 0, то и р к ( — д;) = 0. Наконец, если р к х — 0, р 1 у~ О 
и если, например, к^І, то 

Р к (х+У) = О, 

т. е. порядком элемента х-{-у служит или число р к , или делитель 
этого числа, т. е. во всяком случае некоторая степень числа р. 
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Беря в качестве р поочередно каждое из чисел (1), мы получим 
у ненулевых подгрупп 

Р» Р* р ,- ( 2 ) 

Группа О является прямой суммой этих подгрупп, 

0=р 1 + р 2 + ... + р 5 . (3) 

Действительно, если х — произвольный элемент группы О, то 
его порядок I может делиться лишь на некоторые простые числа 
из системы (1), 

1 = • • • Р 3 Ч 

где 0, г = 1 , 2, у. Поэтому, как показано в конце пред- 
шествующего параграфа, циклическая подгруппа {*} разлагается 
в прямую сумму примарных циклических подгрупп, имеющих соот- 
ветственно порядки р *», ..., р*«. Эти примарные циклические 

подгруппы лежат в соответственных подгруппах (2) м и, следовательно, 
элемент х представляется в виде суммы элементов, взятых по од- 
ному во всех или некоторых из подгрупп (2). Этим доказано 
равенство 

® = {Ръ Р ѵ 

аналогичное равенству (6) из предшествующего параграфа. 

Для доказательства равенства, аналогичного равенству (7) из 
того же параграфа, возьмем любое і, 2^г^$. Тогда любой эле- 
мент у из подгруппы {/\, Я 2 , Я._ 1 } имеет вид 

у — а 1 + й 2 • + а і-1. 

где элемент а ) , у — 1 , 2, / — 1, лежит в подгруппе Р 1 , т. е. 

имеет порядок р *). Тогда 

(р\'Р к Г- . . р*і.-‘)У = 0, 

т. е. порядком элемента у служит некоторый делитель числа 
р\'Р к 2 - • -Р к і~і и > следовательно, элементу, если он отличен от нуля, 
не может содержаться в подгруппе Р { . Этим доказано, что 

{^і? Р%і • • ■» ^і-і} П Р{ — О, 
что и требовалось доказать. 

Заметим, что абелева группа, порядки всех элементов которой 
являются степенями одного и того же простого числа р, называется 
примарной относительно числа р. Примарные циклические группы 
являются частным случаем, примарных групп. Таким образом, под- 
группы (2) примерны. Они называются примарными компонентами 
группы О, а прямое разложение (3) — разложением этой группы 
в примарные компоненты. Так как подгруппы (2) определены 
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§ 67 ] 


в группе О однозначным образом, то и разложение группы О 
в примарные, компоненты определено однозначно. 

Разложимость всякой конечной абелевой группы в прямую сумму 
примарных групп сводит, понятно, доказательствооснов- 
ной теоремы на случай конечной при марной абеле- 
вой группы Р, относящейся к некоторому простому 
числу р. Рассмотрим этот случай. 

Пусть а г будет один из элементов группы Р, имеющих в ней 
наивысший порядок. Если, далее, в группе Р имеются ненулевые 
элементы, циклические подгруппы которых пересекаются с цикли- 
ческой подгруппой {а х } лишь по нулю, то через а 2 обозначим один 
из элементов наивысшего порядка среди элементов с этим свой- 
ством; таким образом 

К}пК}=о. 

Пусть уже выбраны элементы а г , а 2 , . а--],. Подгруппу груп- 
пы Р, порожденную их циклическими подгруппами, обозначим 
через {а 1( а 2 , . . ., а,_х}, 

{{ а і}> •*•! { а / — г} } == { а і'» •••> а ;-і}- (4) 

Она состоит, очевидно, из всех элементов группы Р, которые могут 
быть записаны в виде суммы элементов, кратных элементам а и 
а г , . . сг і _ 1 ; будем говорить, что эта подгруппа порождается эле- 
ментами а х , а 2 , а,_х- Обозначим теперь через а і один из эле- 

ментов наивысшего порядка среди тех элементов группы Р, цикли- 
ческие подгруппы которых имеют равное нулю пересечение с под- 
группой {«х, а 21 а^_х}; таким образом 

{ а іі а я> • ••> а ;-і} П 0* (5) 

Ввиду конечности группы Р этот процесс должен остановиться; 
пусть это произойдет после того, как будут выбраны элементы а І7 
а г , . . . , а 3 . Если через Р' мы обозначим подгруппу, порожденную 
этими элементами, 

Р == { а х, Я 2 , ..., я^}, 

Р' = {{а х}, К}. ..., {я,}}, (6) 

то, следовательно, циклическая подгруппалюбого нену- 
левого элемента группы Р имеет с подгруппой Р' 
ненулевое пересечение. 

Равенство (6) и равенство (5), справедливое для і = 2, 3, ....,&, 
показывают, ввиду (4), что подгруппа Р' является прямой 
суммой циклических подгрупп {«х], {я 2 }, •••> { й Л> 

Р' = { а і} + { а і} + • • • + { а Л- (7) 

Остается доказать, что подгруппа Р' на самом деле сов- 
падает со всей группой Р, 
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Пусть х — любой элемент группы Я, имеющий порядок р. Так как 

Р'[\{х\фЪ, 

а подгруппа {л:} не имеет ненулевых подгрупп, отличных от нее 
самой — напомним, что порядок подгруппы является делителем по- 
рядка группы, а число р простое, — то в действительности под- 
группа {л;} содержится в подгруппе Р' и, следовательно, х при- 
надлежит к Р' . Таким образом, все элементы порядка р из группы Я 
входят в подгруппу Я'. 

Пусть уже доказано, что в подгруппу Я' входят все элементы 
группы Я, порядок которых не превосходит числа р к ~ г , и пусть 
X — любой элемент из Я, имеющий порядок р к . Как показывает 
выбор элементов я,, я 2 , ..., а а , порядки их идут не возрастая и 
поэтому можно указать такое і, 1 ^ і — 1 ^ что порядки элементов 
я 1 , я 2 , ..., я 1 _ 1 больше или равны р к , а при і — 1<$ порядок 
элемента а 1 строго меньше этого числа, т. е. меньше порядка 
элемента х. Отсюда следует, ввиду условий, которым подчинен 
выбор элемента я ( ., что если 

Р={я 1 , я 2 , ..., 

ТО 

<3 П {*} Ф 0. 

В предшествующем параграфе было доказано, однако, что всякая 
ненулевая подгруппа примарной циклической группы {л:} порядка 
р к содержит элемент 

у=р к ~ 1 х. (8) 

Элемент у входит, следов-ательно, в пересечение а поэтому 

и в подгруппу 0. Это позволяет записать у в виде суммы эле- 
ментов, кратных элементам а 1г а г , а і _ 1 , 

у=к а \~кк а гк- . . . (9) 

Из (8) следует, что элемент у имеет порядок р. Поэтому 
(Рк) «і + (Рк) а 2 + • • • + (Рк-і) а,_ г = 0, 
т. е., ввиду существования прямого разложения (7), 

(Р*/)«/= 0, 7=1, 2, ..., і— 1. 

Число рк должно, следовательно, делиться на порядок элемента а^ у 
а поэтому и на число р к , откуда вытекает, что к делится на р к ~ 1 , 

к~ Р к ~ 1 т,, 7=1, 2 I — 1. (10) 

Пусть 

г = т 1 а 1 + т 2 а 2 + . . . +т і . 1 а і _ 1 . 

Это будет элемент нз подгруппы 5, а поэтому и из подгруппы Я', 
причем, ввиду (9) и (10), 

у=р к ~і г . 


(И) 
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Из (8) и (11) вытекает равенство 

р 4 - 1 {х— г) = 0, 

т. е. порядок элемента 

і = х—г 

не больше р 4_1 и, следовательно, в силу индуктивного предположе- 
ния і содержится в подгруппе Р’ . Поэтому и элемент х, как сумма 
двух элементов из Р', х — г-\ -і, принадлежит к подгруппе Р 1 . Этим 
доказано, что все элементы порядка р 4 из группы Р содержатся в Р'. 

Наше индуктивное доказательство позволяет утверждать, следо- 
вательно, что все элементы группы Р входят в подгруппу Р\ т. е. 
Р' = Р. Доказательство основной теоремы закончено. 

В качестве побочного продукта мы получаем, что конечная абе- 
лева группа тогда и только тогда будет примаркой относи- 
тельно простого числа р, если ее порядок является степенью 
этого числа р. В самом деле, было показано, что всякая конечная 
примарная (по р) абелева группа Р разлагается в прямую сумму 
примарных (по р) циклических групп, а поэтому порядок группы Р 
равен произведению порядков этих циклических групп, т. е. является 
степенью числа р. Обратно, если конечная абелева группа имеет 
порядок р 4 , где р — простое число, то порядок любого ее элемента 
будет делителем этого числа, т. е. также некоторой степенью 
числа р, а поэтому группа оказывается примарной относительно р. 

Основная теорема еще не исчерпывает вопроса о полном описа- 
нии конечных абелевых групп, так как пока не исключена возмож- 
ность того, что прямые суммы двух различных наборов циклических 
групп, примарных по некоторым простым числам, могут оказаться 
изоморфными группами. На самом деле это не имеет места, как 
показывает следующая теорема: 

Если конечная абелева группа О разложена двумя способами 
в прямую сумму примарных циклических подгрупп, 

6 — { а і} + { а г} + • • • + { а Л = {^і} + {^г} + • ■ ■ + {М> 02) 

то оба прямых разложения обладают одним и тем же числом 
прямых слагаемых, в = і, и между прямыми слагаемыми этих 
разложений можно установить такое взаимно однозначное со- 
ответствие, что соответствующие слагаемые являются цикли- 
ческими группами одного и того же порядка, т. е. изоморфны. 

Заметим сначала, что если мы в первом, например, из прямых 
разложений (12) соберем прямые слагаемые, относящиеся к данному 
простому числу р, то их прямая сумма будет примарной (по р) 
подгруппой группы О и даже примарной компонентой этой группы, 
так как ее порядок равен наивысшей степени числа р, на которую 
делится порядок группы О. Объединяя этим способом прямые сла- 
гаемые в каждом из разложений (12), мы в обоих случаях получим 
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разложение группы О в примерные компоненты, единственность ко- 
торого уже была отмечена выше. 

Это позволяет доказывать нашу теорему в предположении, что 
группа О сама является при марной относительно 
простого числа р. Пусть нумерация прямых слагаемых в каждом 
из разложений (12) выбрана так, что порядки этих слагаемых идут 
не возрастая, т. е. элементы а 1( а 2 , ..., а 5 имеют соответственно 
порядки 

/А /А /А 

причем 

& 2 к 3 * 


а элементы Ъ 1% Ъ 2 , Ъ і — порядки 


причем 


рЧ рЧ .... рЧ 


і \ ■ ■■' /2 ■ ■■' - • * ■ ' А . 


Если бы утверждение нашей теоремы не имело места, то нашлось 
бы такое і, 1, что 

• • ч = Ч— іі (13) 

но 

к ( ф 1 { . 

Понятно, что г«^тіп($, ^), так как для каждого из разложений (12) 
произведение порядков всех прямых слагаемых равно порядку 
группы О. Покажем, что наше предположение приводит к противо- 
речию. 

Пусть, например, 

*/<//. (14) 

Обозначим через Я совокупность элементов группы О, порядки 
которых не превосходят рЧ Это будет подгруппа группы О, так 
как если х и у — элементы из Я , то и х-\-у, и — х имеют по- 
рядки, не превосходящие числа р кі . 

Заметим, что к подгруппе Я принадлежат, в частности, следую- 
щие элементы: 

р кі ~ кі а ѵ р к *~ к *а 2 , р к *-'~ к 1 а { _ 1 , а ; , а і+1 , ..., а 3 . 

С другой стороны, если 1^/^г — 1, то элемент р к з~ к *~ 1 а^ имеет 
порядок р к і +1 и поэтому в Я не входит. Отсюда следует, что смеж- 
ный класс а,]-\- Я (напоминаем, что мы используем аддитивную запись!) 
имеет, как элемент фактор-группы О/Я, порядок р к і~ к *; таков же 
порядок его циклической подгруппы -[-Я}. Докажем, что группа 
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О/Н является прямой суммой циклических подгрупп 
{пу + Я}, у— 1, 2, і — 1 , 

0/Н= [а г + Я} + {п 2 + //} + ... -К {а г _ х -)- Я}, (15) 

и поэтому ее порядок. равен числу 

уг)(^|— Ар + (Ь 2 -*») + . ..+(*»_ 1-І»)^ (16) 

Если х — произвольный элемент группы О, то существует запись 
х = т 1 а 1 + гп г а. г + гп^а^ 

Пусть для у=1, 2, і — 1 

т ] = р к г к Щ ] + П], 


0^п ^ <р к ^- к ^. (17) 

Тогда 

т і а і = Чі (Р к} ~ кіа }) + п і а ], 

а так как первое слагаемое правой части содержится в Я, то 

т } а ] - + Н— п.]й] + Я. 

С другой стороны, 

т і а 1 : + Н = Я, ..., т а а 5 -{- Н= Н. 

Поэтому 

л: + Я=(ет 1 а 1 + Я) + (/» 2 а 2 + Я)+ ... +(/» 5 а*+Я) = 

= (л 1 а 1 + Я) + (л 2 « 2 -г Я) + • • • + ( л /-і а ,-і + Я). (18) 

Пусть существует еще одна такая запись, 

#~Ь ( л і а і ~ЬЯ) + («2^2 + Я) -}- . . . + + Я), (19) 


О ^п/<р к }- к ‘, у=1, 2, ..., і— 1. 


Тогда элементы 


п 1 а 1 -^п 2 а 2 + ...+п і _ 1 а [ _ 1 


п 1 а 1 -(- я 2 а 2 + . . . + п і - х а г-і 

лежат в одном смежном классе по Я, т. е. их разность принадле- 
жит к Я и поэтому 

Р кі [(« 1 — «х ) а 1 +(п 2 — п' 2 )а. 2 + . . . +(//,-_!— п'і -і) «,_!]= 0. 
Отсюда следует (так как первое из разложений (12) — прямое), что 
р к і(п / —п' і )а / =0, 7 = 1 , 2 , ..., /— 1 , 
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а поэтому число р кі (я у — Л/) должно делиться на порядок р к і эле- 
мента а 1 и, следовательно, разность — л', делится на число р к г к \ 
Отсюда, ввиду (17) и (20), следует, что 

Яу = Л/, і— 1, 2, і — 1, 

т. е. записи (18) и (19) тождественны. Этим доказано существова- 
ние прямого разложения (15). 

Аналогичные рассмотрения, проведенные для второго из прямых 
разложений (12), покажут, что эта же фактор-группа О/Н обладает 
прямым разложением 

0/Н= {Ь 1 4- Н) -)- {Ь 2 -\-Н) ф- . . . + {^;_і -\-Н} {Ь і + Н} + . . . , 

т. е., ввиду (13) и (14), ее порядок должен быть строго больше 
числа (16). Это противоречие доказывает теорему. 

Полное обозрение конечных абелевых групп нами теперь уже 
получено. Именно, берем всевозможные конечные наборы нату- 
ральных чисел 

(«г. « 2 . •••. Ч)> 

отличных от единицы, н.о не обязательно различных, причем 
каждое из этих чисел должно быть степенью некоторого про- 
стого числа. Каждому такому набору ставим в соответствие 
прямую сумму циклических групп, порядками которых служат 
числа из этого набора. Все полученные этим путем конечные 
абелевы группы будут попарно неизоморфными, а любая другая 
конечная абелева группа изоморфна одной из этих групп. 
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